이번 주 IT 판에는 여러가지 일이 있었습니다. 5G 불통 문제가 제일 심각했고, 갑작스럽게 터진 갤럭시 폴드 디스플레이 문제도 있었죠. 그 와중에 조용히, 여러 회사에서 화면이 달린 AI 스피커를 출시하며/하기위해 운을 띄우고 있기도 했습니다. 물론 전 그보다 일본 라인에서 출시된, 클로바 데스크-에 더 관심이 가 있었습니다만.

클로바 데스크는 가정용 디지털 사이니지, 간단히 말해 디지털 정보 알림판-의 역할을 하겠다고 나선 기기입니다. SF 영화에서 많이 보던, 아침에 일어나면 오늘 일정은 어떻게 날씨는 어떻게 이렇게 말해주는 비서 같은 존재죠. 주방에서 영상으로 레시피를 보여주기도 하고요. 새로운 것은 아니고, 소니에서 팔고 있는 음성인식 디스플레이가 이런 시나리오를 제시한 바 있습니다. 엄청 비싸지만요(...).

전 그것보다, 이 영상 통화 장면이 더 인상에 남더라구요. 커뮤니케이션 기능도 중요한 축인데, 화상 통화를 할 수 있게 됐습니다. 스노우에서 쓰던 것처럼 AR 기능을 활용해, 여러가지 스티커를 씌워서, 셀카를 찍는 느낌으로 화상통화를 할 수 있는 게 재미있어요. 전에도 생각했던 기능인데(스노우에서 화상 채팅하는 것), 구현했더군요.
... 자고로 화상 통화라면 셀카앱에서 포샵질 해주는 것 정도는 보여줘야 하지 않겠습니까(응?).
반면, 한국에서 나오는 AI 스피커는 기본 음악 감상 기능에다가, 아동용- 콘텐츠를 더한 형태입니다. 아하하하.

먼저 SKT 누구 네모. 디스플레이를 탑재하고 아동용 콘텐츠를 보강했습니다. 통화 기능은 나중에 넣을거라고 하네요.


KT는 기가지니 테이블TV를, LGU+에서는 U+AI 어벤저스 스피커를 출시할 예정이라고 합니다. 3사 공통점이라면, IPTV 제공 회사 답게, IPTV 를 응용한 보조 서비스 관점에서 접근한다는 점일까요. 카카오나 네이버는 별 움직임 없는 거에 비하면 환영할만한 일이지만, 가장 큰 문제는, 지금 AI 스피커는 바보-라는 겁니다.
예를 들어(저는 카카오랑 클로바를 쓰고 있습니다), 카카오에게 '어디까지 얼마나 걸려?' 하고 물으면 '~분 걸립니다~'하고 대답합니다. 그래서 '어떻게 가면 돼?' 하면 '카카오맵에서 검색해 보세요'라고 말... 뭐랄까, 얻을 수 있는 정보가 굉장히 제한적이에요.
뭐, 뭔가를 사용자가 기억하고 명령어를 내뱉어야 제대로 반응한다는 건 그냥 포기해도(사실 이 때문에 음악 듣기랑 날씨, 환율 같은 간단한 정보 묻는 거 제외하면 안쓰게 됩니다), 다른 서비스랑 연동도 안하려 하고, 그래서 가끔 쓰다보면 답답할 때가 많습니다.
이런 문제, 해결될 날이 오긴 올까요?
* 카카오에서 카톡 연동한, 화상통화 집어넣으면 나름 인기 좋을지도요.
* 1인 사용 모드 따로 개발해서, 혼자 쓰는 사람은 다양한 개인정보를 표시할 수 있도록 해줘도 좋겠죠.
* 광고는 절대 넣지 말기를 바랍니다(...).
* 필요한 정보, 자기가 프로그램 짜서 넣는 기능은 안들어갈까요? 좋아하는 계정에서 트윗이 올라왔는지 확인할 수도 있을테고, 인스타그램에서 뭔가를 검색해서 딱- 보여줘도 될거고, 틱톡 인기 영상만 틀어주거나 좋아하는 유튜브 방송만 시청할 수 있어도 좋을텐데 ... 쓰다보니 안 넣어줄 것 같네요.

클로바 데스크는 가정용 디지털 사이니지, 간단히 말해 디지털 정보 알림판-의 역할을 하겠다고 나선 기기입니다. SF 영화에서 많이 보던, 아침에 일어나면 오늘 일정은 어떻게 날씨는 어떻게 이렇게 말해주는 비서 같은 존재죠. 주방에서 영상으로 레시피를 보여주기도 하고요. 새로운 것은 아니고, 소니에서 팔고 있는 음성인식 디스플레이가 이런 시나리오를 제시한 바 있습니다. 엄청 비싸지만요(...).

전 그것보다, 이 영상 통화 장면이 더 인상에 남더라구요. 커뮤니케이션 기능도 중요한 축인데, 화상 통화를 할 수 있게 됐습니다. 스노우에서 쓰던 것처럼 AR 기능을 활용해, 여러가지 스티커를 씌워서, 셀카를 찍는 느낌으로 화상통화를 할 수 있는 게 재미있어요. 전에도 생각했던 기능인데(스노우에서 화상 채팅하는 것), 구현했더군요.
... 자고로 화상 통화라면 셀카앱에서 포샵질 해주는 것 정도는 보여줘야 하지 않겠습니까(응?).
반면, 한국에서 나오는 AI 스피커는 기본 음악 감상 기능에다가, 아동용- 콘텐츠를 더한 형태입니다. 아하하하.

먼저 SKT 누구 네모. 디스플레이를 탑재하고 아동용 콘텐츠를 보강했습니다. 통화 기능은 나중에 넣을거라고 하네요.


KT는 기가지니 테이블TV를, LGU+에서는 U+AI 어벤저스 스피커를 출시할 예정이라고 합니다. 3사 공통점이라면, IPTV 제공 회사 답게, IPTV 를 응용한 보조 서비스 관점에서 접근한다는 점일까요. 카카오나 네이버는 별 움직임 없는 거에 비하면 환영할만한 일이지만, 가장 큰 문제는, 지금 AI 스피커는 바보-라는 겁니다.
예를 들어(저는 카카오랑 클로바를 쓰고 있습니다), 카카오에게 '어디까지 얼마나 걸려?' 하고 물으면 '~분 걸립니다~'하고 대답합니다. 그래서 '어떻게 가면 돼?' 하면 '카카오맵에서 검색해 보세요'라고 말... 뭐랄까, 얻을 수 있는 정보가 굉장히 제한적이에요.
뭐, 뭔가를 사용자가 기억하고 명령어를 내뱉어야 제대로 반응한다는 건 그냥 포기해도(사실 이 때문에 음악 듣기랑 날씨, 환율 같은 간단한 정보 묻는 거 제외하면 안쓰게 됩니다), 다른 서비스랑 연동도 안하려 하고, 그래서 가끔 쓰다보면 답답할 때가 많습니다.
이런 문제, 해결될 날이 오긴 올까요?
* 카카오에서 카톡 연동한, 화상통화 집어넣으면 나름 인기 좋을지도요.
* 1인 사용 모드 따로 개발해서, 혼자 쓰는 사람은 다양한 개인정보를 표시할 수 있도록 해줘도 좋겠죠.
* 광고는 절대 넣지 말기를 바랍니다(...).
* 필요한 정보, 자기가 프로그램 짜서 넣는 기능은 안들어갈까요? 좋아하는 계정에서 트윗이 올라왔는지 확인할 수도 있을테고, 인스타그램에서 뭔가를 검색해서 딱- 보여줘도 될거고, 틱톡 인기 영상만 틀어주거나 좋아하는 유튜브 방송만 시청할 수 있어도 좋을텐데 ... 쓰다보니 안 넣어줄 것 같네요.
덧글
ㅋㅋㅋㅋ 핵심을 짚으셨네요.
AI speaker에 엄청난 투자들을 하는 이유가 바로 저거죠.
광고, 광고 6초광고를 30분 정도의 동영상에 무려 7개를 넣는 이 상황을 당해보면 그런 소리가 나옵니다.
Google Assistant의 경우에는 안드로이드 앱 짜듯이 App을 짜서 올릴 수 있는 걸로 알고 있습니다.
https://medium.com/@abhi007tyagi/google-assistant-app-in-5-min-d23f5c16ec44
이게 잘 되면 app을 팔 수도 있게 만들지 않을까 생각합니다.
Clova의 경우 hackathon 같은 것도 했었는데 정작 찾을려니 음성인식/합성 API 정도만 나오네요.
https://www.ncloud.com/product/aiService