구글에는 제미니 서비스가 있지만 AI Stuido란 서비스도 있습니다. 굳이 얘기하면 서비스라고는 말하기 어렵고, 개발자를 위해서 구글의 멀티모달 생성형 AI 모델 제품군을 빌드해볼 수 있게 만들어본 개발자용 사이트라고 보면 됩니다. 하지만 일반인도 사용하기에 따라 제미니 보다 더 유용하게 사용할 수 있는 면이 있으므로 기본적인 사용법을 알아보고자 합니다.
AI Studio 제공 기능들
1. 제공 기능
Create Prompt: 일반 제미니 서비스와 똑같이 채팅을 위한 프롬프트를 생성하는 최초의 화면입니다. 여기서 대화를 시작하시면 됩니다.
Stream Realtime: 멀티모달 기능인 제미니 라이브를 사용해볼 수 있는 공간입니다. 음성, 비디오, 화면공유 기능을 사용 해볼 수 있습니다.
음성, 비디오, 화면공유 기능 사용 가능
Starter Apps: 멀티모달 기능인 스타터앱을 사용해볼 수 있는 공간입니다. 공간 이해(객체 탐지), 비디오 분석, 지도 탐색 기능을 사용해볼 수 있습니다. 아마 처음 제미니 멀티모달 기능 나왔을 때 광고를 보셨던 분이면 알 수 있을텐데, 영상을 촬영하면서 라이브로 제미니한테 "이 물건은 뭐야?" 라고 물어보면서 객체를 탐지하는 기능이 해당 기능에 포함되어 있습니다.
객체 탐지 기능들이 주로 포함되어 있다.
Tune a model: 모델 파인튜닝(답변 지침 등 설정)하는 기능
Library: 대화가 저장되는 곳
이 글에서는 다른 멀티모달 기능에 대해서는 다루지 않고 Create Prompt의 채팅 기능에 대해서 주로 다룹니다.
2. AI Studio는 무료야? 유료야?
AI Studio의 사용은 무료입니다. 애초에 웹에서 사용가능한 것은 무료로 밖에 제공하지 않습니다. 유료로 사용하려면 API로 불러서 사용하거나, 제미니 어드밴스드를 결제해서 제미니 사이트에서 사용해야합니다. 그럼 유료와 무료의 성능차이는 있어? 라는 질문이 생길 수 있는데요, 같은 모델(예를 들어, 2.0Flash)이라면 성능 차이도 없습니다. 하지만 두 가지 큰 차이점이 있습니다.
채팅에서 사이드바 모델에 마우스를 올리면 상세 정보를 확인할 수 있다.
(1) 모델별로 사용 가능한 토큰의 제한: 아래 이미지에서 노란색 부분을 보면 Token count라는 부분이 있습니다. 한 대화당 토큰의 제한이며, Gemini 1.5 pro 모델의 경우 2만 토큰을 사용하면 그 대화를 더 이상 이어나가지 못합니다. 또한, 일당, 시간당 대화가 가능한 수가 제한되어 있습니다. 밑의 Rate limits를 보면 제한을 볼 수 있는데요. 2.0Flash 모델의 경우 하루에 1500번, 분당 사용 횟수가 15회로 제한되어 있습니다.
무료는 대화당 토큰 제한이 있다.
일/시간당 대화제한
(2) 대화한 내역은 재학습에 활용: 무료의 경우 대화한 내역은 구글의 모델 재학습에 활용됩니다. 그러므로 개인 정보와 같은 민감한 정보는 절대 입력하지 마세요.
위와 같은 2개의 단점이 있음에도, AI Studio는 매우매우매우 유용한 도구입니다.
3. AI Studio를 사용하는 이유?
(1) 토큰 제한 넘어갈 일이 거의 없다: 토큰 제한이 있습니다만 저 토큰 제한을 넘어갈 일이 거의 없습니다. 그리고 넘어가면 대화방을 하나 더 만들면 토큰은 초기화 됩니다.왜냐하면 대화방당 토큰이 제한되어 있기 때문입니다.
(2) 새로운 모델의 우선 사용: 제미니에는 새로운 모델이 바로 업로드 되지 않는 경우가 있지만, AI Studio에는 새로운 모델이 바로 업로드 되서 미리 사용해볼 수 있습니다.
(3) 검열 설정 가능(제미니 보다 자유로운 사용): AI Studio를 사용하는 가장 큰 이유가 아닐까 싶습니다. 제미니에서는 불가능한 성적 대화, 폭력적 대화 등이 AI Studio에서는 가능합니다. 물론 수위 제한은 어느 정도 있지만 수치를 조정해서 제미니 보다 훨씬 자유로운 대화가 가능합니다.
어드밴스드 세팅을 통해 검열 설정을 할 수 있다.
4. API키 발급
API키는 좌측 상단의 Get a APIKey를 클릭하면 간편하게 발급받을 수 있습니다.
결제 설정을 하지 않으면 돈이 안 나가니 걱정하지 않아도 된다.
기본적으로 API도 똑같이 무료이며, 무료와 유료API의 차이는 위에서 설명한 것과 같습니다. 성능 차이는 없으나, 토큰, 하루 및 분당 사용량 제한이 있으며, API 사용 내역은 모델 재학습에 이용됩니다. 유료의 경우 재학습에 활용하지 않습니다. 워낙 가격이 싸다보니 개인정보가 걱정되신다면 API 호출해서 개발하실 분들은 그냥 유료로 사용하셔도 괜찮을 것 같고, 개발이 아니라 개인 취미 수준이시라면 무료를 사용해도 충분할 것으로 보입니다.
생성형AI 모델은 여러 가지가 있습니다. 제일 유명한 ChatGPT도 있고, 앤트로픽의 클로드, 구글의 제미니, 최근에는 그록도 있죠. 이 중 가장 싼 모델은 뭐냐?라고 물어보면 구글 제미니를 들 수 있습니다. 구글은 다른 기업들 보다 공격적인 가격 정책을 통해 LLM을 제공하고 있습니다. 사실상 무료라고 볼 수 있는데요. 그럼에도 유료(Advanced)가 있는데 유료랑 차이가 뭐지? 모델 성능 차이가 나나?와 같은 질문이 생길 수 있습니다. 그래서 무료와 유료 플랜의 차이를 알아보려고 합니다.
결론 세 줄 요약
1. 같은 모델을 선택한다면 무료/유료든 답변 성능 차이는 없다.
2. 유료 결제를 할 경우 + 구글 드라이브 2TB, 워크 스페이스(메일, 슬라이드 등) 추가 기능, LLM 입력 컨텍스트양 증가, 노트북LM 컨텍스트양 증가, 딥리서치 모델 사용의 장점이 있다.
3. 근데 한국에서는 구글 워크스페이스 보다는 MS를 많이 사용하므로 위의 장점이 상쇄되므로, 구글 드라이브가 필요한 사람이 아니라면무료 플랜을 사용하자.
무료/유료 모델의 성능 차이가 있을까?
제미니 무료 제공 모델들
현재 제미니의 무료 제공 모델은 2.0 플래시, 2.0 플래시 띵킹(추론 모델), 2.0 플래시 띵킹 with apps가 있습니다. 유료에도 동일한 모델이 있으며 추가로 딥리서치 모델이 있습니다. 무료든 유료든 동일한 모델을 선택할 경우 예를 들어, 무료의 2.0 플래시 모델이든, 유료의 2.0 플래시 모델이든 성능 차이는 없습니다.
그럼 무료와 유료는 어떤 차이가 있을까?
(1) 컨텍스트 양 차이
입력 및 답변의 컨텍스트 양이 차이가 있습니다. 보통 LLM 모델의 입력 가능 텍스트양, 답변의 양, API 비용 산정 등에는 토큰 단위 계산을 사용합니다. 간략하게 했을 때 영어 단어 1개가 1토큰 이라고 생각하면 됩니다. 무료 플랜의 경우 이 토큰이 유료 플랜 보다 적으며, 유료 플랜의 경우 100만 토큰(PDF1500장)까지 사용이 가능합니다. 그런데 보통 일반 사용자가 이 정도 사용할 일 없으니 사실상 장점이 되지 않을 것으로 판단됩니다. 무료 모델의 토큰만으로도 충분합니다.
(2) 워크스페이스 연계 활용
구글에는 워크스페이스라는 것이 있습니다. 제일 유명한 G메일, 구글 시트 등이 있죠. 이 서비스들을 사용할 때 제미니를 동시에 사용할 수 있는 연계 기능이 추가되게 됩니다.
워크스페이스에 제미니를 연계해서 사용
예를 들어보자면, 구글 독스에서 문서를 작성할 때 오른쪽에 제미니를 띄워서 자동 작성 요청, 내용 요약 ... 등 작업을 할 수 있는거죠. 또 지메일에서 메일 요약, 메일 답변 자동 생성 등을 할 수 있습니다.
이렇게만 봤을 때는 오 꽤 편할 것 같은데? 라고 생각할 수 있습니다만, 한국에서의 워크스페이스 사용량을 보면 말이 달라집니다. 직장인이시라면 워크스페이스를 사용하시는 분이 아마 없으실 겁니다. 한국에서는 대부분 기업이 MS오피스를 사용하기 때문에 사실상 구글 독스(한글 또는 MS 워드), 구글 슬라이드(MS의 파워포인트) 등 워크스페이스 사용율이 적기 때문에 큰 도움이 되지 않을겁니다. 더욱이 내가 구글 워크스페이스를 사용하더라도 클라이언트가 워크 스페이스를 사용하지 않으면 문서 통합이 되지 않기 때문에 불편해서 쓰지 않게 될겁니다. 그래서 한국 한정 이 기능은 있으나 마나다 라고 생각됩니다.
(3) 그럼 유료 결제하는 사람은 호구냐?
그럼 유료 왜 쓰냐? 라고 할 수 있습니다. 사실상 2TB 구글 드라이브 쓰는 비용 내면서 추가로 제미니 체험해보는 격이라고 보면 됩니다. 그래서 2TB 구글 드라이브를 원래 사용하시는 분들, 또는 최근 클라우드 사용할 생각이 있어서 찾고 있었던 분이 아니라면 굳이 유료 플랜 결제를 추천 드리지는 않습니다.
사실상 유료 플랜을 사용하는 이유인 2TB 스토리지
또한 노트북LM이라는 솔루션이 있는데요. 문서 정리, 논문 요약, 아이디어 생성에 좋은 도구는 맞습니다만, 해당 솔루션도 무료 플랜으로 50개의 문서를 등록해서 사용할 수 있고, 유료 플랜을 할 경우 추가 기능 + 등록할 수 있는 문서 수가 늘어나지만 사실상 전문 연구자가 아니신 일반인 사용자들은 무료 플랜으로도 충분히 사용할 수 있습니다.
(4) 구글은 왜 이렇게 제품을 판매할까?
그럼 구글은 왜 무료/유료 크게 구분하지 않고 이렇게 장사를 하고 있을까요? 생성형 AI의 특성을 보면 알 수 있는데요. 결국 생성형 AI는 양질의 데이터들을 계속적으로 학습해서 그 성능을 개선해나갑니다. 무료로 사용자에게 풀면서 양질의 데이터를 수집해 LLM의 성능을 계속 개선하는 것입니다. 사실상 무료가 아닌 보이지 않는 데이터 값을 우리는 내고 있는 것이라 보면 되는거죠. 우리가 인스타그램을 쓴다고 무료로 쓰는 것일까요? 아니죠. 광고에 노출됨으로써 광고비를 간접적으로 지불하고 있는거죠. 그것과 똑같은 개념이라고 보시면 됩니다.
이런 식으로 장사를 할 수 있는 것은 구글이라는 기업의 덩치 덕분입니다. 크롬이라는 검색 시장의 장악, 안드로이드라는 모바일 시장의 장악, 또 유튜브라는 든든한 캐시카우가 있기 때문에 LLM 모델을 무료로 제공하면서 시장을 선점하고, 양질의 데이터를 얻는 전략을 보이고 있습니다. 그리고 자사가 가지고 있는 소프트웨어 제품(워크스페이스)와 하드웨어 제품(한국에는 없지만 구글 픽셀 시리즈)그리고 안드로이드를 사용하는 다른 제조사들의 스마트폰에서 제미니를 무료로 사용하게 함으로써 LLM 시장 선점을 하고 있는 것이죠. 안드로이드를 오픈으로 풀면서 스마트폰OS 시장을 장악했던 전략과 똑같이 하고 있다고 보시면 됩니다.
구글의 주주인 제 입장에서는 아주 잘 하고 있다고 생각됩니다. 경쟁이 박터지고 있는 LLM 시장에서 제미니를 유료로 푼다고 해서 얼마의 수익을 볼 수 있을까? 라고 한다면 긍정적인 답변을 하긴 어렵습니다. 그렇다면 이렇게 접근성을 높여 시장을 선점하는 것도 좋은 전략이라고 생각됩니다.
그래서 정리해보자면 무료/유료 모델의 성능 차이는 없으니, 구글 드라이브가 필요한 고객이 아니라면, 무료로만 사용하자로 정리할 수 있습니다.
구글 CEO인 순다르 피차이가 웨이모의 세계화를 시작한다는 말을 하면서 웨이모에 대해 간단히 정리해보려고 합니다.
1. 웨이모(Waymo)란?
구글 웨이모
웨이모는 구글 산하에서 자율주행 기술 개발을 전문으로 하는 기업임. 현재 수준을 보았을 때 고정밀 지도 기반 자율주행 기술 분야에서 독보적 위치를 선점하고 있음. 핵심 기술은 딥러닝 기반의 컴퓨터 비전인데, 딥러닝을 통해 주변 환경을 3차원 벡터 공간으로 정밀하게 모델링하고, 이를 바탕으로 안전하고 효율적 자율주행을 위한 추론을 수행함. 또한 라이다, 레이더, 초음파 세너와 같은 다양한 출처로부터 얻은 복합 데이터를 융합하여 실시간 고정밀 지도를 생성하고 업데이트를 하고 있음. 이러한 기술을 통해 웨이모는 운전자 개입 없는 완전 자율주행화를 현실화 하고 있음.
2. 웨이모의 변천 과정
웨이모에 불을 지르는 사건이 일어나기도 했었다. 순탄치만은 않았던 웨이모 개발
웨이모는 생각보다 시작이 오래 되었음. 2004년 스탠퍼드대 세바스찬 스런 교수가 이끄는 자율주행 자동차 팀에서 뿌리를 찾을 수 있음. 2007년 그랜드 챌린지에서 기계 학습 기반 차량으로 뛰어난 성과를 거둔 뒤 2009년 1월 핵심 팀을 꾸려 구글 산하에서 자율주행 자동차 프로젝트를 본격적으로 시작.
이후 2016년 12월 법인으로 독립하며 사업 확장에 나섰고, 자율주행 기술 안전성과 실용성 검증을 위한 노력이 이어짐. 2017년 미국 애리조나주 피닉스에서 자율주행 택시 시범 서비스를 시작하며 상용화 첫걸음을 내딛음. 2018년 12월 피닉스 대도시 권역에서 상업 자율주행 서비스인 웨이모 원(Waymo One)을 공식 출범시키며 세계 최초 로보택시 서비스 시대를 열었음. 2020년 10월에는 안전 요원이 탑승하지 않는 완전 무인 자율 주행 자동차 운행을 공식적으로 시작하며 기술적 완성도를 더욱 높임.
2024년 1월에는 LA에도 로보택시 라이선스를 신청하며 서비스 지역 확대를 본격화하기 시작했으며, 최근 세계화를 시작한다고 순다르 피차이가 발표하면서 화제가 됨.
3. 웨이모의 주행 테스트 결과
주행 테스트 결과를 보면 인간 운전자보다 78% 안전하다고 나타남. 이미 3,300만 마일 넘는 누적 주행 거리를 기록했으며, 2023년 기준 490만 건 이상의 승객 운송을 수행함. 특히 주당 평균 15만 건 이상의 유료 승차를 기록하며 상업적 성공 가능성도 보여주고 있음. 고속도로에서도 시험 운행을 시작하며 자율주행 기술의 적용 범위를 넓혀나가고 있음. 2024년 2분기 웨이모 매출은 3억 6,500만 달러(약 4,860억 원)를 기록하며 꾸준한 성장세를 나타내고 있음.
4. 웨이모의 세계화
웨이모의 첫 진출지 도쿄
웨이모는 미국 시장에서 성공적 운영으로 글로벌 시장 진출을 본격화 하고 있음. 첫 번째 해외 진출지는 도쿄임. 웨이모는 2025년 초 도쿄에서 시범 운행을 시작하며 해외 시장 공략의 신호탄을 쏘아 올릴 예정이라고 함. 이를 위해 일본 최대 택시 회사인 니혼 코츠 및 차량 호출 서비스 고(Go)와 전략적 파트너십을 체결했다고 함.
얼마 전 구글은 일본에서 자사 스마트폰 픽셀을 공격적인 마케팅, 매우 저렴한 가격으로 판매를 하였음. 이것도 웨이모가 진출하는 것과 연관이 없어 보이지 않음. 한국에서 카카오톡 - 카카오택시로 이어지는 것처럼 자사 제품들의 연계성을 강화시키기 위한 의도로 판단됨.
다시 도쿄 이야기로 돌아와서, 초기 단계에서는 니혼 코츠의 숙련된 운전기사가 함께 탑승하여 도쿄 주요 지역을 수동으로 운전하며 자율주행 데이터를 쌓을 예정이라고 함. 웨이모가 일본을 첫 해외 진출지로 선택한 이유는 일본 차량 운전석이 오른쪽에 있다는 점을 고려했다고 함. 웨이모는 우측 운전석 및 좌측 통행 규칙을 따르는 국가 데이터가 부족하기 때문에 일본 시범 운행을 통해 이런 데이터를 수집하고자 했다고 함.
5. 웨이모의 미래
웨이모는 2025년까지 10개 새로운 도시로 서비스 지역을 확장한다는 계획을 발표하였음. 일본 시장 진출을 시작으로 해외 시장 진출에 박차를 가해 본격적으로 매출을 끌어올릴 것으로 기대됨. 자율주행 기술 개발에 대한 알파벳의 50억 달러 추가 투자 계획에서도 이 의도는 분명하게 드러남.
구글은 AI 연산을 위해 자체 개발 반도체를 가지고 있는데 TPU(Tensor Processing Unit)가 그것입니다. TPU는 수학 연산 처리에 특화된 칩입니다. 구글의 발표에 따르면 생성형 AI 유니콘 기업의 90%가 구글 클라우드의 TPU를 선택해서 사용하고 있다고 합니다. 여기에는 미드저니, 앤트로픽 등 유명 AI 기업도 포함되어 있습니다.
TPU 탄생 배경과 GPU와의 차이점
구글의 TPU
AI용 칩하면 가장 먼저 떠오르는게 GPU인데요. GPU와 차이점은 GPU는 그래픽 및 범용 병렬 연산이 설계 목적인 반면, TPU는 딥러닝(연산)에 최적화 되어 있다는 점입니다. 또한 GPU는 AI 연산 뿐만 아니라 게임 등 다양한 작업 지원을 하는 반면 TPU는 오직 딥러닝 전용으로만 높은 성능과 효율성을 제공한다는 점입니다. 구글의 TPU가 이렇게 한정된 목적을 가진 이유는 TPU의 탄생 배경부터가 운명을 결정했기 때문입니다. 2013년 피치카 PM은 음성검색 기능을 도입하면서 AI 연산을 위한 특별한 하드웨어가 필요하다는 것을 깨달았다고 합니다. 당시 계산 결과 1억 명의 사용자가 하루 3분씩만 음성검색 기능을 사용해도 데이터 센터 용량을 2배로 늘려야할 만큼 비용이 막대했다고 합니다. 이에 구글은 10년간 AI 연산에 특화된 TPU 개발에 역량을 집중했다고 합니다.
트릴리움
트릴리움에 대한 발표
2013년 최초 TPU가 발표되고 2017년에는 최초 클라우드 TPU를 선보인 뒤 지속적으로 성능 개선을 보여주고 있습니다. 최근에는 트릴리움이라는 새로운 TPU를 발표했는데요. 트릴리움은 TPU v5e에 비해 칩당 최대 컴퓨팅 성능이 4.7배 향상되었다고 합니다. 현재 트릴리움이 적용될 것으로 예상되는 서비스로는 에이전트입니다. AI 에이전트(Agent)는 특정 작업을 수행하거나 문제 해결을 위해 설계된 인공지능 시스템인데요, 사용자와 외부 환경과 동시에 상호 작용을 하면서 입력 데이터를 처리하고 학습 또는 의사결정을 하는 시스템입니다. 현재 단순한 챗봇을 넘어서 프롬프트를 입력했을 때 컴퓨터 내부의 조작도 하고, 더 진보된 명령을 수행하는 것을 기대할 수 있습니다. 오픈AI도 그렇고 현재 모든 AI회사의 목표는 AI 에이전트로 맞춰져있는데요, TPU는 이런 AI 에이전트를 구현하는데 특히 중요한 역할을 할 것으로 보입니다.
AI 시대 구글의 강점
구글 본사
제가 생각하는 AI 시대 구글의 강점은 자체적으로 모든 것을 조달이 가능한 기업이라는 점입니다. 최근 애플이 AI쪽으로 힘을 못 쓰고 있는 이유는 뭘까요? 과거와 다르게 애플 자체에서 모든 것이 수급이 되지 않는 다는 점입니다. 하드웨어, 소프트웨어 두 부분에서 모두 강점을 가지고 있었지만 AI에서는 강점이 없어서 현재 본인들의 하드웨어와 소프트웨어를 AI에 통합하지 못하고 있죠. 그래서 외부적으로 AI에 있어서 좋지 않은 평가를 받고 있습니다. 반면 구글은 하드웨어에서는 애플 보다 단점을 보이지만 어쨌든 제품군을 보유하고 있고, 공격적인 판매전략으로 하드웨어 상품을 점점 보급하고 있습니다. 소프트웨어 쪽으로는 크롬 등 말할 필요도 없고, AI쪽으로는 현재 LLM의 기반 기술이 된 트랜스포머나 최근 노벨상을 받은 알파폴드, 또 과거에는 알파고 등 유명한 기술들이 너무 많고 인력들도 유명하죠. 가장 강력한 경쟁자인 오픈 AI와 비교해보자면 구글의 강점은 자본력입니다. 오픈AI는 시작부터가 비영리 기업이였기에 공격적으로 투자 유치를 못하고 있으며, 현재 투자 유치를 위해 영리 기업 전환을 준비하고 있다는 기사도 보이고 있지만 견제로 인해 쉽게 하지 못하고 있습니다. 하지만 구글은 애초에 영리 기업이었으며 여러 사업분야의 캐시카우(유튜브, 인터넷 광고)를 보유하고 있습니다. 결국 장기 경쟁인 AI 경쟁 시장에서 보았을 때, AI를 보급할 수 있는 하드웨어와 소프트웨어, AI 기술력, 자본력을 모두 보유하고 있는 구글은 AI 시대에 엄청난 강점을 보유하고 있다고 할 수 있습니다.
저는 이러한 내용을 기반으로 구글에 지속적으로 투자를 하고 있습니다. 아마 장기적으로 투자를 할 것 같아요. 당장 경제가 어려워진다고 망할 회사도 아니고, 기술력이 부족한 회사도 아니기 때문입니다. 그렇다고 경영적으로 크게 문제가 있냐고 하면 그것도 아닙니다. 또한 사회적으로 이미지도 좋은 기업입니다. 최근 반독점 때문에 노이즈가 있긴 하지만 저는 결국에 반독점 법에 의해 큰 피해를 보지 않을 것이라 보기 때문입니다.
업무를 하다보니 GPT를 쓸 일이 많아서 유료 플랜 결제를 했습니다. 유료 플랜에서 제공하는 기능들 중 내 GPT 만들기라는 기능이 있어 사용해보고, 어떻게 만드는지 알아보고자 합니다.
1. 용도
내 GPT를 어디에 쓸 수 있을까?를 생각 해봤을 때, 대화방이 새로 만들어질때마다 시작할 때 던지는 대화 퀄리티에 따라 앞으로의 대답 퀄리티가 달라지게 되는데 이런 퀄리티 유지에도 영향을 줄 수 있죠. 예를 들어, 영어 공부를 위해 활용한다면 대화가 길어지면 버벅거리는 것이 심해지기 때문에 대화를 여러 번 만들고, 만들 때마다 "~를 위해 영어 선생님이 되어줘, 조건은 ~고..."를 계속 입력했다면 이것을 하나의 GPT로 만들어놓고 활용할 수 있습니다.
영어로 대화하면서 문법을 교정해주는 영어 선생님을 만들어보겠습니다.
우측 상단 내 GPT로 이동
우측 상단 클릭 후 내 GPT로 이동
GPT 만들기 클릭
GPT 만들기 클릭
2. 구성 설정
만들기를 먼저 할 수도 있는데 목적이 있다는 가정하에 하는 것이기 때문에 구성을 먼저 입력하도록 하겠습니다. 구성에는 아래의 프롬프트를 입력해줬습니다.
내 영어 선생님이 되어줘. 내 수준은 유치원 수준이야. 만약 내가 영어로 얘기했을 때 문법적으로 틀렸다면 올바른 문장과 함께 대화도 유지해줘. --- (답변 예시) <문법 체크> 올바른 문법과 틀린 부분에 대한 간략한 설명 <대화> 나와 하고 있는 대화에 대한 진행(영어로 해야 함)
대화스타터는 처음 대화할 때 나오는 보기 같은 것인데 입력하지 않아도 무방합니다. 지식, 기능은 그대로 뒀습니다.
이름, 설명 등 본인이 원하는 것 입력
모두 입력 후 새 작업 만들기를 클릭하지 마시고, 다시 만들기로 이동해줍니다.
만들기
준비된 프롬프트를 입력해주면 됩니다. 저는 아래와 같이 입력했습니다.(위의 프롬프트와 동일)
내 영어 선생님이 되어줘. 내 수준은 유치원생 수준이야. 만약 내가 영어로 얘기했을 때 문법적으로 틀렸다면 올바른 문장과 함께 대화도 유지해줘. --- (답변 예시) <문법 체크> 올바른 문법과 틀린 부분에 대한 간략한 설명 <대화> 나와 하고 있는 대화에 대한 진행(영어로 해야 함)
GPT 만들기
입력하고 나면 여러가지 질문을 하는데 대답을 하고 모두 설정이 완료되었다면 우측 상단의 만들기를 클릭해주면 됩니다. 또한 미리보기에서 대화를 통해 테스트 해볼 수 있습니다.
제가 입력한 프롬프트로 하게 된다면 아래와 같은 결과가 나옵니다. 꽤 괜찮게 쓸 수 있을 것 같아요.
요즘 일렉을 연습하고 있는데 고민이 있었습니다. 오인페를 가지고 있지만 연습하기 위해서 컴퓨터를 켜고, 오인페를 연결하고, DAW를 켜고... 이 과정이 너무 귀찮더라고요. 어떻게 쉽게 해결할 수 있을까 고민하다가 스파크 미니라는 앰프를 알게 되었고 바로 구매를 했습니다.
2. 구매 가격 및 구매처
구매는 알리에서 했고 총 구매 가격은 약 16만원 입니다. 국내에서는 공식 수입처를 통해서 구입을 하면 32만원입니다. 너무 비싼데 직구를 하시길 추천합니다. 알리에서 원래 구매 가격은 20만원이었는데요, 네이버페이 포인트 할인 + 할인 쿠폰 5% 정도를 먹이니 16만원이 되더라고요. 배송은 1주일만에 왔습니다. 정말 급해서 내가 이틀만에 배송을 받아야한다 라는 분이 아니면 무조건 알리 직구를 추천드립니다.
16만원에 구매한 스파크 미니
디자인이 너무 예뻐서 좋고, 크기도 정말 작습니다. 고는 더 작다고 하는데, 미니도 충분히 작아서 백팩에 넣을 수 있습니다.
프리셋: 프리셋은 등록할 수 있는 바로가기 입니다. 프리셋에 원하는 톤을 등록해놓으면 바로 돌려서 전환할 수 있습니다.
기타: 기타 톤을 먹였을 경우 기타 소리의 조절을 할 수 있습니다.
뮤직: 휴대폰의 소리입니다. 스파크는 휴대폰에서 재생한 음악도 재생이 가능하기 때문에 해당 노브로 조절하시면 됩니다.
<후면>
헤드셋 연결을 할 수 있는 단자, 충전을 할 수 있는 USB, 블루투스 페어링을 위한 페어 버튼, 전원 버튼이 있습니다.
4. 블루투스 연결 방법
블루투스 연결을 두 가지를 해줘야 합니다. <1> 악기 연결(이펙터를 먹이기 위해) <2> 스마트폰 연결(스마트폰의 소리를 앰프 출력을 하기 위해)
스파크 연결 화면
<1> 악기 연결: 블루투스명 Spark MINI BLE
(1) 스파크 앱을 설치한다.
(2) 스파크 전원을 켜고 스파크 앱을 접속한다.
(3) 블루투스 연결, 제품 등록 등이 뜨는데 진행해준다.
(4) 테스트 해본다.
스파크 연결을 하면 아래와 같은 이펙터 화면을 볼 수 있습니다.
스파크의 이펙터 연결 화면
첫 번째 화면의 좌측 상단 RHYTHM 버튼을 누르면 두 번째 화면 처럼 원하는 이펙터를 설정할 수 있습니다. 매우 간편합니다. 음악 스타일에 따라 기본적으로 제공되는 프리셋이 있습니다.
첫 번째 화면의 우측 상단 구름 모양을 누르면 클라우드에 다른 사용자들이 등록한 이펙터 조합도 사용할 수 있습니다. 세 번째 화면을 보면 확인할 수 있습니다.
Audio와 BLE 모두 연결해주자
<2> 스마트폰 연결: 블루투스명 Spark MINI Audio
BLE만 연결할 경우 악기 소리만 나오고 스마트폰의 소리는 나오지 않게 됩니다. 스파크 앱의 설정쪽에 들어가면 블루투스 연결 상황을 볼 수 있는데 오디오를 연결하지 않을 경우 Audio는 꺼져 있는 것을 확인할 수 있습니다. 이 때는 아래와 같은 과정을 진행해줍시다.
(1) 스파크 미니와 스파크 앱 모두 끄기(연결되어 있는 BLE를 제거할 필요 없음)
(2) 스파크 미니만 켜기
(3) 후면의 블루투스 페어링 켜주기
(4) 스마트폰으로 블루투스 검색(스파크 앱에서 연결을 진행하는게 아닙니다. 스파크 앱을 끈 상태에서 스마트폰의 블루투스 검색을 통해 Spark MINI Audio를 연결해주세요.)
(5) Audio 연결이 확인 되었다면 다시 스파크 앱을 켜고 BLE도 연결되는지 확인
5번까지 완료되면 세 번째 이미지 처럼 두 개의 블루투스가 연결됨을 확인할 수 있습니다.
5. 장점 및 단점
<장점>
(1) 편리함
원래 기타 오인페에 연결, 컴퓨터 켜기, DAW 켜기, 설정하기 ... 이런 귀찮은 과정을 거쳐야하는데 안 거쳐도 되므로 너무 편해졌습니다. 오인페 연결이 귀찮았던 분은 무조건 구매하세요.
(2) 합리적인 가격
알리를 기준으로 했을 때 입니다. 솔직히 한국 정발 가격 32만원으로 구매하라고 하면 그렇게 가성비가 좋다고 느끼지는 못했을 것 같습니다. 하지만 알리로 구매하면 절반의 가격에 구매할 수 있고, 그러면 가성비가 최고라고 할 수 있습니다. 기타를 구매하면 주는 15w 똘똘이 앰프, 그것보다 조금 윗 수준의 애매한 앰프를 쓸바에는 스파크 미니가 훨씬 좋다고 할 수 있습니다.
(3) 이펙터 찍먹의 기회
초보자는 이펙터에 대해서 잘 모릅니다. 그리고 고가의 멀티이펙터는 부담이 되고, 그렇다고 필요한 이펙터만 따로 구매하기에도 가격이 제법 듭니다. 또한 따로 구매하더라도 결국에는 여러 개의 이펙터를 사야하기 때문에 고급 멀티이펙터 뺨 때리는 가격이 되게 됩니다. 처음 이펙터 설정도 잘 모른다면 이렇게 편리한 이펙터는 없다고 생각합니다.
(4) 디자인
컴팩트하고 너무 예쁩니다. 그릴도 다른 색으로 바꿀 수 있던데 그건 솔직히 좀 돈 아까운 것 같아요(추가금 발생, 공홈을 통해서만 가능). 하지마세요. 그냥 검은색 또는 흰색 중에 기본으로 구매합시다.
(5) 그 외 다수의 편의 기능들
메트로놈, 튜너, 잼(내가 음을 치면 AI로 자동 드럼 등 다른 악기로 생성해줌) 등 여러 기능이 있습니다. 무엇보다 유튜브로 음악을 들으면서, 유튜브 영상에서 나오는 타브악보를 보면서 내가 기타로 치면 방구석에서도 합주하는 느낌을 낼 수 있기 때문에 너무 좋습니다. 방구석 기타리스트, 초보 기타리스트에게 이만한 장점을 줄 수 있는 기기가 있을까요?
<단점>
(1) 블루투스 앰프로서는 조금 부족한 음질
구매가격 16만원을 생각했을때, 블루투스 앰프로서의 음질이 그렇게 뛰어나지는 않습니다. Pebble V3라는 약 5만원 정도하는 스피커를 저는 사용하고 있는데요. 비교해보았을 때 페블이 조금 더 음질이 좋은 것 같습니다. 제가 느끼기에는 저음부가 좀 빈약한 것 같습니다. 하지만 애초에 이 용도가 아니기 때문에 용서가 되고, 정필요하다면 헤드셋을 연결할 수 있는 단자가 있기 때문에 이 단점은 신경 쓰이지 않습니다.
6. 미니 VS 고 어떤 걸 골라야할까?
제가 선택한 기준을 말하면 아래와 같습니다.
(1) 휴대를 자주 하지 않는다. 99% 방에서 사용한다. -> 스파크 미니 승. 그리고 백팩에 넣어봤을 때 스파크 미니도 들어갑니다.
(2) 블루투스로 음악을 들을 때 가끔 사용할거다. -> 스파크 미니가 음질이 그렇게 좋은 편은 아니지만 활용 가능한 수준이고, 고 보다는 확실히 음질이 좋을 것 같습니다.(체급 차이)
(3) 알리 구매 시 한국에서 스파크 고를 구매하는 가격으로 스파크 미니를 살 수 있다.
만약에 내가 헤드폰만 사용한다라고 하시면 스파크 고로 가세요. 헤드폰을 꽂을 경우 스파크 미니든 고든 음질은 헤드폰에 의해서 정해집니다.
휴대성이 매우 중요하다라고 하시면 스파크 고로 가세요. 스파크 미니가 백팩에 들어가기는 하지만 긱백에 넣기는 힘듭니다. 스파크 고는 긱백에 충분히 넣을 수 있습니다.
만약 저와 같은 환경이시라면 무조건 미니 선택을 하시길 추천드립니다. 휴대성 빼고는 미니가 다 압승이라고 생각하고, 17만원의 가격이 부담스러운 수준은 절대 아니라고 생각되기 때문입니다.
We’re testing SearchGPT, a temporary prototype of new AI search features that give you fast and timely answers with clear and relevant sources.
open ai에서 새로 개발한 검색 엔진으로 현재는 프로토타입의 형태입니다. 사용은 불가능하고 미리 사전 등록이 가능한 것으로 보이니 관심 있는 사람은 open ai 홈페이지에 들어가서 하면 됩니다. 매우 간단하니 금방 하실 수 있습니다.
검색
search gpt의 검색 화면
검색화면은 기존 gpt와 동일하게 챗봇 형태입니다. 아무래도 대화 형식으로 상호작용하는 것을 강조하고 있다보니 크게 변화는 시키지 않은 모양입니다. 나중에 정식 출시가 만약에 된다면 어떻게 될 지 모르겠지만 지금 봤을 때는 깔끔하고 좋네요.
검색 결과
search gpt의 검색 결과
검색 결과가 조금 특이하긴 한데 오른쪽에는 이미지와 함께 게시물 내용이 요약해서 제공되고, 왼쪽에서도 리스트 형태로 비슷하게 제공되네요. 지금 이 이미지만 봤을 때는 좌측과 오른쪽의 차이점을 잘 모르겠는데 좌측에서 신기한 점은 sns 처럼 좋아요, 싫어요 표시를 할 수 있는 것을 볼 수 있습니다. 아마 저 좋아요, 싫어요를 통해 계산을 해서 앞으로 노출될 결과물의 형태를 조절할 수 있을 것으로 보이네요.
추가 질문
지속적인 대화를 통한 참여율 향상
검색 결과가 나오면 검색 결과에 대해 질문을 하고 공감을 하면서 대화형식으로 서치를 진행할 수 있어 차별점이 있다고 합니다. 사실 구글에 검색하는 것과 차이점을 저는 잘 못 느끼겠네요. 그냥 검색하던 검색어를 대화 형식으로 물어볼 수 있다는 건데... 거기에서 차이점을 느낄 수 있나?는 잘 모르겠네요.
open ai 사이트에 들어가보면 강조하고 있는 점을 알 수 있습니다. 요약하자면, 중요한 정보를 어떻게 보여주고, 정보 제공자와 질문자 상호 참여성을 높이는데 주안점을 두고 있다고 합니다.
In addition to launching the SearchGPT prototype, we are also launching a way for publishers to manage how they appear in SearchGPT, so publishers have more choices.In addition to launching the SearchGPT prototype, we are also launching a way for publishers to manage how they appear in SearchGPT, so publishers have more choices.
위의 문구를 보면 정보의 게시자는 자신이 올린 게시물이 어떻게 서치gpt에서 보여지게 될 지에 대해서도 정할 수 있다고 합니다. 이 설정에 따라 노출의 빈도가 달라질 것도 같아 어떻게 구성될지 궁금한 부분입니다. 즉 search gpt는 정보 게시자가 자신의 정보의 노출에 대해서도 조정할 수 있고, 검색하는 사람도 좋아요, 싫어요를 통해 자신이 노출될 정보를 조정할 수 있는 형태로 보입니다. 검색하는 사람이 어떤 정보에 노출될 지 정할 수 있는 것은 기존 구글 검색에는 없던 형태라 좋을 것으로 보입니다.
광고 수익
광고 수익은 어떻게 변경되게 될까요? 현재 가장 사용이 활발한 구글을 기준으로 본다면 구글 애드센스를 통해 게시자에게 수익이 창출되는 형식입니다. 예를 들어 내가 게시물을 올리고, 검색자가 내 게시물을 클릭하는 순간 광고에 노출되고, 그 수를 카운팅해서 게시자에게 수익이 돌아가는 형식이죠. 오픈 ai의 서치gpt는 어떻게 수익 구조를 만들까요?
검색 광고 대표 주자 구글 애드센스
(1) 대화형 콘솔에서 나타난 검색 결과를 클릭한다면 해당 링크로 접속하게 되고, 기존과 동일하게 애드센스 광고에 노출되면서 구글에서 수익이 분배 되는 방식
-> 기존과 구조는 변경되는 사항이 없으나 gpt를 통해서 페이지로 접속하게 됩니다. 아마 가능성이 가장 높지 않을까 싶어요. 광고 수익을 게시자들에게 또 분배할 필요는 없으니까요. 이 방식에서 중요한 부분은 게시자가 search gpt에 자신의 글을 노출시키는 것에 대해 동의할 것인지가 중요하고, 이것에 대한 절차가 만들어져야 할 것입니다. 구글 서치 콘솔에 블로그를 등록해본 사람들은 알 것인데, 해당 방식과 유사한 방식으로 openai의 사이트에 들어가서 search gpt에 자신의 블로그를 등록하지 않을까 싶습니다.
(2) search gpt에 게시글이 노출된다면 그 노출 수에 따라 수익이 분배 되는 방식. 또한 여기에 더해 그 페이지로 접속하게 된다면 애드센스를 통한 추가 수익이 분배 되는 방식
-> 게시자 입장에서는 이중 수익을 얻을 수 있기 때문에 좋을 것으로 보이는데 open ai 입장에서 진행할지는 의문입니다. search gpt에 자체 광고를 달지 않는 이상은 이럴 일은 없을 것 같습니다. search gpt는 당연히 무료로 풀릴 것으로 보이는데 거기에 더해 게시자들에게 광고 수익을 더 분배 한다는 것이 가능할까 싶습니다.
중요한 것은?
검색에서 중요한 것은 정확한 정보를 주는 것, 신뢰성 있는 정보를 주는 것입니다. 속도는 이미 실시간 대화 수준으로 올랐으므로 걱정이 되지 않습니다. 정확한 정보, 신뢰성 있는 정보를 주는 것은 기존 챗봇들의 문제인 환각 문제와 연관성이 있는데 이를 어떻게 해결했을지 궁금하긴 합니다.
또 궁금한 것은 어떤 모델을 사용했을지입니다. 왜냐하면 모델에 따라 가격도 상이하고 성능도 상이하기 때문입니다. gpt 유료 플랜을 사용하는 사람은 검색 엔진에서도 더 높은 성능의 모델을 적용해서 search gpt를 사용할 수 있을지 궁금한데, 해당 질문에 대한 답은 아직 없었습니다.
효과가 있을까?(신규 고객을 창출할 수 있을까?)
개인적으로는 기존 gpt 사용을 하던 사람은 사용해보겠지만 새로운 유입이 크게 있을 것 같지는 않습니다. 사람은 익숙한 것을 사용하는 경향이 있습니다다. 또한 구글 검색이 크게 불편한 점이 있냐고 질문한다면 그것도 아닙니다. 굳이 옮길 필요가 없는 것이죠. 그렇다고 정보의 질이 search gpt가 그렇게 좋냐?라고 한다면 그것도 아닙니다. 결국 구글에서 검색되는 정보들이 동일하게 나타날 것입니다. 결국 정보 큐레이션의 차이가 중요할텐데 구글에서 나타나는 결과에 비해 얼마나 더 좋은 큐레이션을 해줄 수 있을지 의문입니다. 이와 관련해 좋아요, 싫어요는 좋은 기능으로 보이는데 이건 구글에서도 쉽게 도입할 수 있는 기능이니까 그렇게 차별점이 될 지는 잘 모르겠습니다.
그리고 중요한건 구글도 이미 ai 검색 서비스를 제공하고 있습니다. 구글 검색을 해보면 ai 검색 결과를 최상단에 띄워주는데 이와 비슷한 수준일 것 같습니다. 단지 구글에서는 검색 창에서 시작하지만 search gpt는 대화형 콘솔에서 시작을 한다는 것 외에는 차이가 없을 것으로 보여요.
구글의 현재
최근 주춤하고 있는 구글의 주가
구글은 최근 주가가 주춤하고 있습니다. 실적은 잘 나왔습니다. 대부분 부문에서 실적치를 상회하였고, 긍정적 평가를 받았습니다. 하지만 ai에 대한 회의론과 함께 다음 분기에는 지출이 클 것으로 보인다는 컨센, 그리고 openai에서 search gpt를 발표하면서 타격을 받고 있습니다. openai 보다 조금 늦게 출발했지만 바드에서 제미니로 바꾸고, 검색 ai도 도입하고 어느 정도 잘 따라갔고 있다고 판단됩니다. 무엇보다 구글을 높게 평가하는 것은 트랜스포머 모델의 개발 시초이면서, 여러 소프트웨어, 하드웨어도 보유하고 있으며, 클라우드도 보유하고 있다는 점인데요. 아무래도 다른 기업의 서비스나 플랫폼을 가져와서 쓰는 것보다 본인들이 가진 소프트웨어와 하드웨어를 사용할 수 있으면 더 시너지를 발휘하기 좋을 것이기 때문입니다. 또한 연구 개발에 쓰이는 비용은 든든한 캐시카우인 유튜브와 검색 광고 부문에서 조달할 수 있습니다.
AI를 통한 특이점이 오는 시점은 언제일까?
최근 AI 관련 기술주들의 주가가 출렁이면서 AI 회의론이 점점 떠오르고 있습니다. 또한 애플은 애플 인텔리전스 랍시고 발표를 하기는 했지만 결국 삼성에서 하는 것 이상의 뭔가를 보여주지는 못했습니다. 물론 퀄리티는 더 좋을 것입니다. 아무래도 내부 데이터를 적극적으로 활용할 것이기 때문이고, 애플의 생태계가 애초에 너무 잘 구성되어 있기 때문입니다.
특이점이 오는 시점은 언제일까요? 제가 생각하기에 특이점이라고 할 수 있는 부분은 영화 her 처럼 실시간 대화 형식으로 자유롭게 대화를 할 수 있는 순간이라고 생각합니다. 그리고 그건 얼마 남지 않았다고 생각합니다. 2~3년 내에 구현은 가능할 것으로 보이고(이미 구글 io와 open ai 기술 포럼에서도 발표가 됨), 기술이 본격적으로 퍼지기 시작하는것은 넉넉 잡아도 2030년에는 가능하지 않을까 싶습니다.
영화 her의 ai와 대화하는 장면
왜 영화 her를 특이점의 시작으로 보냐에 대한 대답은, 다른 AI 접목 기술은 결국 하드웨어의 발전이 필요하기 때문입니다. 예를 들어, 로봇에 AI를 달아서 뭔가를 하는 것은, 소프트웨어는 이미 어느 정도 가능한 수준에 왔지만(챗봇들을 보면 그렇다), 하드웨어는 아직 멀었다는 것을 알 수 있습니다. 휴머노이드 형태의 하드웨어가 가장 진보적인 것은 테슬라 쪽으로 보이고, 이것이 사실상 어렵다고 판단한 여러 업체들은 다른 형태의 로봇들을 만들고 있습니다. 예를 들어 현대가 인수한 보스턴 다이내믹스를 들 수 있을 것입니다.
보스턴 다이내믹스의 로봇개
하드웨어의 발전은 더디기도 하고 조금 더 시간이 걸릴 것으로 보입니다. 하지만 소프트웨어는 이미 확실히 her에 나오는 수준에 근접해 있다고 판단됩니다. 실시간성 또한 이미 갖췄습니다. gpt를 써보면 실시간 대화 하듯이 줄줄이 답변이 나오죠. 이제 이것을 온디바이스에서 개인의 스마트폰의 스펙으로 가능하게 만들고, 영상을 보면서 대화를 할 수 있는 수준으로만 만들면 됩니다.(위에서 언급했듯이 이에 대한 프로토 타입은 구글과 open ai에서 이미 구현한 영상이 있다.)
ai에 대한 회의론이 점점 퍼지고 있는 지금이지만, 저는 투자를 지속할 것이고 ai 시대가 올 것임은 의심치 않습니다.
어제 GPT-4o 모델이 발표되면서 이슈가 되었었죠. 애초에 몇 주 전부터 오픈AI에서는 구글 제미나이를 견제하기 위해 구글 IO 2024를 진행하는 바로 전 날에 GPT 모델에 대한 새로운 발표를 할 것이라는 소식을 전했었습니다. 어제 발표 전부터 영화 HER에 대한 언급이 나타나면서 어떤 모델이 나올지 예상이 됐었고, 예상대로의 발표가 나왔었습니다. 오늘은 구글 IO를 보고 구글에서 어떤 것을 개발하고 있는지, GPT-4O 모델에 대항해 제미나이는 어떤 업그레이드 소식이 있는지 알아보겠습니다.
제미나이 모델을 기반으로 실시간으로 캡처된 영상과 음성 데이터를 분석하여 질문에 답변할 수 있는 기능입니다. 이 프로젝트 아스트라가 어제 GPT-4o가 발표한 기능과 완전 같은 기능입니다. 역시 구글에서도 해당 기능에 대해 준비해와서 보여주네요. 두 기업의 경쟁은 이제 어느 쪽의 성능이 좋을까로 귀결될 것으로 보입니다.
영상과 음성을 통합하여 답변을 하는 기능(사용자 질문)위 이미지의 질문에 대한 제미나이의 대답
개인적으로 재미있었던 부분은 아래의 이미지입니다. 화이트보드에 그려져 있는 두 고양이 그림과 사용자가 들고 있는 물음표 박스를 보고 시야에 보이는 것이 슈뢰딩거의 고양이 실험이라는 것을 알아채고 대답을 해주네요.
슈뢰딩거 실험에 대한 제미나이의 대답
2. Veo Generative AI video Model
텍스트, 이미지, 동영상 프롬프트를 기반으로 고화질 동여상을 생성하는 새로운 생성형 AI 비디오 모델입니다. 기존 텍스트를 기반으로 영상을 생성해주는 서비스들이 있었던 것으로 알고 있을 겁니다. 여기에 더해 자기가 원하는 스타일의 이미지나 동영상을 추가해주면 텍스트, 이미지, 동영상을 기반으로 고화질 영상을 생성해주는 서비스 모델이라고 하네요.
veo 생성형 ai 비디오 모델. 텍스트, 이미지, 영상을 기반으로 새로운 영상을 생성해준다
3. Trillium CPU
향상된 성능을 제공하는 6세대 TPU입니다. TPU는 Tensor Processing Unit으로 구글에서 2016년에 발표한 딥러닝용 NPU를 모아놓은 하드웨어 입니다. 개인적으로 이 부분이 구글의 강점이라고 생각하는데 자사의 AI 모델의 학습, 실행에 자신들이 설계한 TPU를 사용하기 때문에 아무래도 다른 회사의 반도체를 사용하는 것보다 훨씬 효율이 좋겠죠.
4. Axion Processor
업계 최고의 성능과 에너지 효율을 자랑하는 새로운 Arm 기반 맞춤형 CPU라고 합니다. 이 부분은 설명을 아주 짧게 하고 지나가서 바로 넘어가도록 하겠습니다.
5. Gemini AI Google Search
검색 결과를 사용자가 이해하기 쉽게 새로운 방식으로 구성하는 검색 기능입니다. 아마 크롬에 달릴 것 같고, 구글에서 검색을 할 때 출처나, 더 향상된 답변을 하는데 도움을 줄 것으로 보여요. 최근 구글에서 검색해보면 최상단에 AI 요약이라고 해서 나타나는 것을 보셨을 수 있는데 그 부분의 업그레이드 버전으로 보면 됩니다.
현재 구글에서 검색하면 AI 요약, 미리보기가 나오는데 그 기능의 확장판이다
6. 그 외 Gemini AI 기능들
Gemini AI Video Search(영상을 통해 질문에 대한 답변을 검색하는 기능), Gemini AI Live Voice Chat(음성 대화를 통해 질문에 답변하는 기능), Gemini AI Gems(사용자가 원하는 주제에 대한 맞춤형 질문 도구), Gemeni AI Context Aware(상황에 맞게 도움을 제공하는 기능) 등이 소개되었는데요. 이 기능들 모두가 1번에서 설명드린 아스트라 프로젝트에 속하는 기능들이고, 이 기능들이 모두 합쳐져 GPT-4O와 같은 영상, 이미지, 텍스트를 기반으로 사용자와 소통할 수 있게 됩니다. 구글의 현재까지의 행보를 보았을 때는 각 기능을 모두 모듈화 하여 API 형태로 제공할 것으로 보여요. 물론 오픈AI도 각 기능을 모두 모듈화 하여 API 형태로 제공할 가능성이 높습니다.
Gemini AI Video Search 시연
7. 안드로이드 업데이트
안드로이드 15에 AI Power Search라는 검색 기능 향상과 Android 15 with Gemini Nano With Multimodality라고 해서 안드로이드에서도 위의 소개된 모든 Gemini의 기능을 사용할 수 있도록 하는 기능이라고 합니다.
8. 결국 구글이 바라는 최종 목표는 구글 생태계 구축
구글은 삼성 스마트폰에도 AI 기능을 제공하고 있고, 국내에는 정식 출시 되지 않았지만 구글 픽셀을 가지고 있기 때문에 안드로이드로 제미나이의 기능을 확장한 것 같습니다. 무엇보다 중요한게 구글은 구글 네스트 같은 구글 홈 장비를 가지고 있는데 추후에는 구글 홈 장비에도 모두 제미나이를 이식해서(최근 구글 어시스턴트를 제미나이로 대체한다는 소식도 봤던 것 같습니다) 모든 하드웨어 제품군을 제미나이로 통합하고 연계할 것으로 예상됩니다. 이렇게 되면 애플의 전략인 강한 연동성으로 사용자를 생태계에서 못 빠져나가게 하는 효과를 볼 수 있을 것으로 보여요.그래서 애플도 최근 타이탄(미래 자동차) 프로젝트를 접으면서 AI를 외치고 있죠. 아직 제대로 된 결과는 못 보여주고 있지만요.
구글이 하고 있는 행보는 올바르다고 생각됩니다. 지금까지는 오픈AI에 비해 뭔가 한 발 느리다, 성능이 조금 떨어지는 것 같다라는 평가를 듣고 있지만, AI에서 가장 핵심적인 모델로 사용되고 있는 트랜스포머 모델을 최초로 개발한 것도 구글이고 자체 칩 보유, 자본력 보유(광고 및 유튜브 등), 자체 클라우드(구글 클라우드) 보유, 하드웨어 제품군 보유(이 부분은 좀 더 개선해서 전체적인 사용률을 올려야 할 것 같긴 함) 등 장점을 많이 가지고 있는 기업입니다. 아무래도 하드웨어 제품군에서 애플이나 삼성에 비해 선호도가 떨어지기 때문에 최근 일본에서 강력한 가격 마케팅을 통해 점유율도 올리려는 노력을 하고 있고, 제미나이의 성능이 정말 일반 사용자들에게도 실생활에 도움이 된다고 하면 하드웨어 제품군 점유율을 높이는데 도움을 줄 것 같아 기대가 되네요.
이번 발표는 사실 기능적으로는 별로 신기한 게 없었습니다. 어제 오픈 AI에서 미리 발표하기도 했고, 오픈 AI는 그에 앞서서 미리 her를 계속 언급하면서 어떤 기능이 발표될 지 보여주고 있었으니까요. 구글이 절대 오픈AI에 비해 기술력이 밀리는 기업이 아니기 때문에 구글도 같은 기능을 발표하겠구나 하고 생각하고 있었습니다. 어쨌든 두 기업이 AI쪽에서는 가장 기술력이 좋은 기업이고, 서로 선의의 경쟁을 하는 것 같아 좋은 것 같습니다.