반응형

SEARCH GPT 란?

We’re testing SearchGPT, a temporary prototype of new AI search features that give you fast and timely answers with clear and relevant sources.

open ai에서 새로 개발한 검색 엔진으로 현재는 프로토타입의 형태입니다. 사용은 불가능하고 미리 사전 등록이 가능한 것으로 보이니 관심 있는 사람은 open ai 홈페이지에 들어가서 하면 됩니다. 매우 간단하니 금방 하실 수 있습니다.

 

검색

search gpt의 검색 화면
search gpt의 검색 화면

검색화면은 기존 gpt와 동일하게 챗봇 형태입니다. 아무래도 대화 형식으로 상호작용하는 것을 강조하고 있다보니 크게 변화는 시키지 않은 모양입니다. 나중에 정식 출시가 만약에 된다면 어떻게 될 지 모르겠지만 지금 봤을 때는 깔끔하고 좋네요.

 

검색 결과

search gpt의 검색 결과
search gpt의 검색 결과

검색 결과가 조금 특이하긴 한데 오른쪽에는 이미지와 함께 게시물 내용이 요약해서 제공되고, 왼쪽에서도 리스트 형태로 비슷하게 제공되네요. 지금 이 이미지만 봤을 때는 좌측과 오른쪽의 차이점을 잘 모르겠는데 좌측에서 신기한 점은 sns 처럼 좋아요, 싫어요 표시를 할 수 있는 것을 볼 수 있습니다. 아마 저 좋아요, 싫어요를 통해 계산을 해서 앞으로 노출될 결과물의 형태를 조절할 수 있을 것으로 보이네요. 

 

추가 질문

지속적인 대화를 통한 참여율 향상
지속적인 대화를 통한 참여율 향상

검색 결과가 나오면 검색 결과에 대해 질문을 하고 공감을 하면서 대화형식으로 서치를 진행할 수 있어 차별점이 있다고 합니다. 사실 구글에 검색하는 것과 차이점을 저는 잘 못 느끼겠네요. 그냥 검색하던 검색어를 대화 형식으로 물어볼 수 있다는 건데... 거기에서 차이점을 느낄 수 있나?는 잘 모르겠네요. 

 

open ai 사이트에 들어가보면 강조하고 있는 점을 알 수 있습니다. 요약하자면, 중요한 정보를 어떻게 보여주고, 정보 제공자와 질문자 상호 참여성을 높이는데 주안점을 두고 있다고 합니다.

 

In addition to launching the SearchGPT prototype, we are also launching a way for publishers to manage how they appear in SearchGPT, so publishers have more choices.In addition to launching the SearchGPT prototype, we are also launching a way for publishers to manage how they appear in SearchGPT, so publishers have more choices.

위의 문구를 보면 정보의 게시자는 자신이 올린 게시물이 어떻게 서치gpt에서 보여지게 될 지에 대해서도 정할 수 있다고 합니다. 이 설정에 따라 노출의 빈도가 달라질 것도 같아 어떻게 구성될지 궁금한 부분입니다. 즉 search gpt는 정보 게시자가 자신의 정보의 노출에 대해서도 조정할 수 있고, 검색하는 사람도 좋아요, 싫어요를 통해 자신이 노출될 정보를 조정할 수 있는 형태로 보입니다. 검색하는 사람이 어떤 정보에 노출될 지 정할 수 있는 것은 기존 구글 검색에는 없던 형태라 좋을 것으로 보입니다. 

 

광고 수익

광고 수익은 어떻게 변경되게 될까요? 현재 가장 사용이 활발한 구글을 기준으로 본다면 구글 애드센스를 통해 게시자에게 수익이 창출되는 형식입니다. 예를 들어 내가 게시물을 올리고, 검색자가 내 게시물을 클릭하는 순간 광고에 노출되고, 그 수를 카운팅해서 게시자에게 수익이 돌아가는 형식이죠. 오픈 ai의 서치gpt는 어떻게 수익 구조를 만들까요?

검색 광고 대표 주자 구글 애드센스
검색 광고 대표 주자 구글 애드센스

(1) 대화형 콘솔에서 나타난 검색 결과를 클릭한다면 해당 링크로 접속하게 되고, 기존과 동일하게 애드센스 광고에 노출되면서 구글에서 수익이 분배 되는 방식

-> 기존과 구조는 변경되는 사항이 없으나 gpt를 통해서 페이지로 접속하게 됩니다. 아마 가능성이 가장 높지 않을까 싶어요. 광고 수익을 게시자들에게 또 분배할 필요는 없으니까요. 이 방식에서 중요한 부분은 게시자가 search gpt에 자신의 글을 노출시키는 것에 대해 동의할 것인지가 중요하고, 이것에 대한 절차가 만들어져야 할 것입니다. 구글 서치 콘솔에 블로그를 등록해본 사람들은 알 것인데, 해당 방식과 유사한 방식으로 openai의 사이트에 들어가서 search gpt에 자신의 블로그를 등록하지 않을까 싶습니다.

(2) search gpt에 게시글이 노출된다면 그 노출 수에 따라 수익이 분배 되는 방식. 또한 여기에 더해 그 페이지로 접속하게 된다면 애드센스를 통한 추가 수익이 분배 되는 방식

-> 게시자 입장에서는 이중 수익을 얻을 수 있기 때문에 좋을 것으로 보이는데 open ai 입장에서 진행할지는 의문입니다. search gpt에 자체 광고를 달지 않는 이상은 이럴 일은 없을 것 같습니다. search gpt는 당연히 무료로 풀릴 것으로 보이는데 거기에 더해 게시자들에게 광고 수익을 더 분배 한다는 것이 가능할까 싶습니다. 

 

중요한 것은?

검색에서 중요한 것은 정확한 정보를 주는 것, 신뢰성 있는 정보를 주는 것입니다. 속도는 이미 실시간 대화 수준으로 올랐으므로 걱정이 되지 않습니다. 정확한 정보, 신뢰성 있는 정보를 주는 것은 기존 챗봇들의 문제인 환각 문제와 연관성이 있는데 이를 어떻게 해결했을지 궁금하긴 합니다. 

또 궁금한 것은 어떤 모델을 사용했을지입니다. 왜냐하면 모델에 따라 가격도 상이하고 성능도 상이하기 때문입니다. gpt 유료 플랜을 사용하는 사람은 검색 엔진에서도 더 높은 성능의 모델을 적용해서 search gpt를 사용할 수 있을지 궁금한데, 해당 질문에 대한 답은 아직 없었습니다.

 

효과가 있을까?(신규 고객을 창출할 수 있을까?)

개인적으로는 기존 gpt 사용을 하던 사람은 사용해보겠지만 새로운 유입이 크게 있을 것 같지는 않습니다. 사람은 익숙한 것을 사용하는 경향이 있습니다다. 또한 구글 검색이 크게 불편한 점이 있냐고 질문한다면 그것도 아닙니다. 굳이 옮길 필요가 없는 것이죠. 그렇다고 정보의 질이 search gpt가 그렇게 좋냐?라고 한다면 그것도 아닙니다. 결국 구글에서 검색되는 정보들이 동일하게 나타날 것입니다. 결국 정보 큐레이션의 차이가 중요할텐데 구글에서 나타나는 결과에 비해 얼마나 더 좋은 큐레이션을 해줄 수 있을지 의문입니다. 이와 관련해 좋아요, 싫어요는 좋은 기능으로 보이는데 이건 구글에서도 쉽게 도입할 수 있는 기능이니까 그렇게 차별점이 될 지는 잘 모르겠습니다.

그리고 중요한건 구글도 이미 ai 검색 서비스를 제공하고 있습니다. 구글 검색을 해보면 ai 검색 결과를 최상단에 띄워주는데 이와 비슷한 수준일 것 같습니다. 단지 구글에서는 검색 창에서 시작하지만 search gpt는 대화형 콘솔에서 시작을 한다는 것 외에는 차이가 없을 것으로 보여요. 

 

구글의 현재

최근 주춤하고 있는 구글의 주가
최근 주춤하고 있는 구글의 주가

구글은 최근 주가가 주춤하고 있습니다. 실적은 잘 나왔습니다. 대부분 부문에서 실적치를 상회하였고, 긍정적 평가를 받았습니다. 하지만 ai에 대한 회의론과 함께 다음 분기에는 지출이 클 것으로 보인다는 컨센, 그리고 openai에서 search gpt를 발표하면서 타격을 받고 있습니다. openai 보다 조금 늦게 출발했지만 바드에서 제미니로 바꾸고, 검색 ai도 도입하고 어느 정도 잘 따라갔고 있다고 판단됩니다. 무엇보다 구글을 높게 평가하는 것은 트랜스포머 모델의 개발 시초이면서, 여러 소프트웨어, 하드웨어도 보유하고 있으며, 클라우드도 보유하고 있다는 점인데요. 아무래도 다른 기업의 서비스나 플랫폼을 가져와서 쓰는 것보다 본인들이 가진 소프트웨어와 하드웨어를 사용할 수 있으면 더 시너지를 발휘하기 좋을 것이기 때문입니다. 또한 연구 개발에 쓰이는 비용은 든든한 캐시카우인 유튜브와 검색 광고 부문에서 조달할 수 있습니다. 

 

AI를 통한 특이점이 오는 시점은 언제일까?

최근 AI 관련 기술주들의 주가가 출렁이면서 AI 회의론이 점점 떠오르고 있습니다. 또한 애플은 애플 인텔리전스 랍시고 발표를 하기는 했지만 결국 삼성에서 하는 것 이상의 뭔가를 보여주지는 못했습니다. 물론 퀄리티는 더 좋을 것입니다. 아무래도 내부 데이터를 적극적으로 활용할 것이기 때문이고, 애플의 생태계가 애초에 너무 잘 구성되어 있기 때문입니다.

특이점이 오는 시점은 언제일까요? 제가 생각하기에 특이점이라고 할 수 있는 부분은 영화 her 처럼 실시간 대화 형식으로 자유롭게 대화를 할 수 있는 순간이라고 생각합니다. 그리고 그건 얼마 남지 않았다고 생각합니다. 2~3년 내에 구현은 가능할 것으로 보이고(이미 구글 io와 open ai 기술 포럼에서도 발표가 됨), 기술이 본격적으로 퍼지기 시작하는것은 넉넉 잡아도 2030년에는 가능하지 않을까 싶습니다.

영화 her의 ai와 대화하는 장면
영화 her의 ai와 대화하는 장면

왜 영화 her를 특이점의 시작으로 보냐에 대한 대답은, 다른 AI 접목 기술은 결국 하드웨어의 발전이 필요하기 때문입니다. 예를 들어, 로봇에 AI를 달아서 뭔가를 하는 것은, 소프트웨어는 이미 어느 정도 가능한 수준에 왔지만(챗봇들을 보면 그렇다), 하드웨어는 아직 멀었다는 것을 알 수 있습니다. 휴머노이드 형태의 하드웨어가 가장 진보적인 것은 테슬라 쪽으로 보이고, 이것이 사실상 어렵다고 판단한 여러 업체들은 다른 형태의 로봇들을 만들고 있습니다. 예를 들어 현대가 인수한 보스턴 다이내믹스를 들 수 있을 것입니다.

보스턴 다이내믹스의 로봇개
보스턴 다이내믹스의 로봇개

하드웨어의 발전은 더디기도 하고 조금 더 시간이 걸릴 것으로 보입니다. 하지만 소프트웨어는 이미 확실히 her에 나오는 수준에 근접해 있다고 판단됩니다. 실시간성 또한 이미 갖췄습니다. gpt를 써보면 실시간 대화 하듯이 줄줄이 답변이 나오죠. 이제 이것을 온디바이스에서 개인의 스마트폰의 스펙으로 가능하게 만들고, 영상을 보면서 대화를 할 수 있는 수준으로만 만들면 됩니다.(위에서 언급했듯이 이에 대한 프로토 타입은 구글과 open ai에서 이미 구현한 영상이 있다.)

 

ai에 대한 회의론이 점점 퍼지고 있는 지금이지만, 저는 투자를 지속할 것이고 ai 시대가 올 것임은 의심치 않습니다.

반응형
반응형

2월 1일자로 바드에 제미나이 프로가 업데이트 되었습니다. 제미나이 프로가 업데이트 되면서 Imagen2 모델을 기반으로 무료 이미지 생성 AI를 이용할 수 있게 되었는데요. 사용 방법 알아보도록 하겠습니다.


1. 바드 접속

검색해서 접속하거나 아래 링크를 눌러줍니다.

https://bard.google.com/chat

 

Google Bard - 생성형 AI 챗봇 사이트

생성형 AI 기술이 적용된 챗봇 AI 사이트, Google Bard로 혁신적인 생산성을 경험하세요.

bard.google.com

바드로 접속
바드로 접속

2. 프롬포트에 명령어 입력

프롬포트에 이미지 생성 명령어를 입력합니다. 여기서 중요한 건 영어로 입력해야 이미지를 생성해주더라고요. 그래서 번역기를 사용해서 입력해주시면 됩니다. 저는 Create an image of a dog riding a surfboard로 입력하겠습니다. 입력해보면 아래와 같이 이미지를 잘 생성해줍니다. 속도도 빠른 편이에요. 텍스트로 대답해주는 것과 차이가 없습니다.

대화형 콘솔에 입력
대화형 콘솔에 입력

그런데 명령어를 입력할 때 규칙이 있는 것 같아요. 오류인 것 같은데, 이미지를 잘 생성하기 위해서는 Create an image of ~ 로 시작하는 문구를 작성해줘야 잘 이미지를 만들어줍니다.

예를 들어서, 아래와 같이 입력을 하면 이미지를 생성해주지 않지만, Create an image of ~ 로 시작하면 이미지를 잘 생성해줍니다.

문구에 따른 다른 결과
문구에 따른 다른 결과
문구에 따른 다른 결과2
문구에 따른 다른 결과2

차이가 있죠? 그래서 영어 번역기를 쓰되, Create an image of ~ 로 시작하는 문구로 입력해주시면 됩니다.


요약: Create an image of ~ 로 시작하는 문구로 이미지 생성 명령을 하면 바드를 무료 이미지 생성 툴로 활용할 수 있다.

함께 보면 좋은 글) 구글 멀티모달 모델 제미나이란?

 

구글 범용 AI 모델 제미나이(Gemini)

구글이 AI 범용 모델 제미나이(Gemini)를 발표하며 주가가 약 5% 급상승했습니다. 얼마전 GPT 개선 모델 발표하면서 구글에서도 제미나이 관련 기사들이 몇 건씩 올라왔었는데, 제미나이 발표도 된

combee.tistory.com

 

반응형
반응형

CES2024에서 삼성이 갤럭시링을 공개했습니다. 몇 년 전부터 링에 대한 소식은 나왔었는데요. 이번에 공개한 갤럭시링의 출시일, 가격, 기능에 대해 알아보겠습니다.


https://www.youtube.com/watch?v=2CZnaPEixfs

1. 출시일

출시일은 정확히 공개되지 않은 상태입니다. 하지만 올 상반기에는 절대 볼 수 없을 것 같고 , CES에서 저렇게 공개했다는 것, 여러 뉴스 정보를 보았을 때는 연말이나 내년에 공개될 것으로 판단됩니다. 

2. 디자인

갤럭시링 외관입니다. 두께가 꽤 있어 보이죠?

아래쪽에 보면 센서도 보이네요.

전면은 아래와 같이 생겼습니다. 심플하게 생겼네요.

아무래도 갤럭시 시리즈가 나오면서 여러 패션 브래드와 협업했던 삼성인만큼, 갤럭시링도 유명 패션 브랜드들과 협업을 해서 한정판 디자인이 나올 것으로 예상됩니다.

3. 가격

가격 정보 또한 공개되지 않은 상태입니다. 하지만 여러 기능이 더 들어가 있는 워치가 30만원 대에 형성되어 있는 것을 보면 20만 중, 후반대가 되지 않을까 생각됩니다. 왜냐하면 아래에 기능을 설명해뒀지만 보면, 헬스케어용도로만 사용되기 때문에 기능이 덜 들어가 있는 만큼 조금 싼 가격으로 책정되지 않을까 판단됩니다.

4. 기능

핵심 기능은 갤럭시 생태계(삼성 헬스 플랫폼)에서 이용할 수 있는 개인화된 건강 모니터링과 코칭입니다. 워치에서는 건강 추적, 전화, 노래 듣기 등 여러 기능이 있었는데 링은 건강 추적에 특화된 기기로 볼 수 있습니다.

4-1. 수면

수면 패턴을 이해하고 직관적 수면 점수와 개인화된 코칭을 제공하여 수면 품질을 향상 시킬 수 있는 습관을 제공한다고 합니다. 또 갤럭시 AI와 함께 건강 패턴에 대한 정보를 제공할 수 있는 새로운 수면 분석 지수를 도입한다고 합니다. HR 알림이라는 기능은 수면 중 심장 박동이 높아지면 알려줘 수면 무호흡에 대한 문제를 해결할 수 있게 도와준다고 하네요. 생체 활성 센서를 활용하면 수면 중 상대적 혈액 산소 농도변화를 모니터링하고 잠재적 무호흡 위험이 있는지도 알려준다고 합니다.

4-2. 약물 관리 

약물과 보충제를 관리하는 새로운 방법으로 소개하고 있습니다. 약물이라고 하면 뭔가 마약 같은 게 떠오를 텐데 그런 약물 보다는 헬스하시는 분들이 사용하는 보충제, 평소 습관적으로 챙겨먹어야하는 약들을 관리할 수 있는 방법입니다. 약 복용 시기를 알려주고, 다른 약물이나 섭취 음식과의 상호 작용에 대한 통찰력을 제공합니다.

4-3. My Vitality Score

신체적 준비, 정신적 준비 상태를 모니터링하여 다가오는 날 얼마나 생산적일 수 있을지 이해할 수 있게 도움을 줍니다. 수면 활동, 심박수, 심장 박동 등 과학적 증거와 전문가 데이터를 바탕으로 오늘 컨디션이 어떤지 미리 받아볼 수 있다고 합니다. 아래와 같이 스코어 및 상태로 나타난다고 하네요.


이렇게 갤럭시링에 대해 알아보았는데요. 애플도 애플링이 나온다는 뉴스가 여럿 있었는데, 갤럭시를 통해 미리 보니 반갑네요. 근데 기능은 헬스케어에만 집중 되어 있어서 원래 워치로 헬스케어 기능을 많이 사용하시는 분들 외에는 기대 이하의 제품일 수 있다는 생각이 드네요.

 

함께 보면 좋은 글) 갤럭시 온디바이스AI

 

삼성 갤럭시 S24 언팩, 온디바이스 AI 기능 리뷰

https://www.youtube.com/watch?v=J7x0E0hLaJ8 온디바이스AI에 대해서 들어보셨나요? 외부 환경을 거치지 않고 기기에서 바로(on-device) 작동하는 AI를 말합니다. GPT는 사용자가 요청을 보낼 시 GPT 서버에서 요

combee.tistory.com

 

반응형
반응형

저는 옵시디언을 이용해서 주로 메모 및 정리를 하는데요. 옵시디언에 smart connections라는 플러그인이 있어서 한 번 사용해보고, 사용방법도 정리해보도록 하겠습니다.


1. 설치 방법

커뮤니티 플러그인에서 smart connectoins을 검색하고 설치해줍니다.

플러그인 설치
플러그인 설치

smart connections 설정으로 가서 OpenAI Settings에서 발급 받은 API 키를 입력해줍니다.

API키 입력
API키 입력

API키 발급 방법은 아래 링크에서 확인해주세요.(API 발급 시 무료 5달러를 줍니다)

 

GPT API 키 발급 받기, 리미트 지정하는 방법

GPT의 API를 발급 받고 결제 제한 지정하는 방법에 대해서 알아보겠습니다. 1. openai 접속 gpt로 접속하는게 아니라 openai 홈페이지로 접속해야 합니다. https://openai.com/ OpenAI Creating safe AGI that benefits al

combee.tistory.com

내 노트들을 GPT 모델에 임베딩 해야 GPT가 읽고 노트간의 연결을 만들어 줄 수 있어서 임베딩 모델 설정을 해줘야합니다.

방금 설정하신 api key 바로 위에 보면 임베딩 모델 설정을 하는 곳이 있는데요. 여기서 notes embedding model의 모델을 openai text-3 small로 지정해줍니다. 다른 모델 해도 되지만, 해당 모델이 비용이 가장 저렴해서 사용했습니다.

설정
설정 수정

저는 206개의 파일을 임베딩 하였고, 발생 비용은 0.01달러입니다. 임베딩에 큰 돈이 들지 않으니 부담 안 가지고 하셔도 됩니다.

비용
비용

2. 기능

2-1. 연관 노트 서칭

smart connections를 설치 후 우측 상단에 보면 플러그인 버튼이 있습니다. 해당 버튼을 누르면 현재 활성화된 노트와 연관된 노트를 보여줍니다. 연관성을 찾아내는 방법은 코사인 유사도를 기반으로 한다고 하고, 오른쪽 리스트에 보면 앞쪽에 0.99와 같은 수치들이 있는데 해당 수치들이 유사도를 나타냅니다. 텍스트 분석에 코사인 유사도가 많이 사용되는데 해당 알고리즘 가져와서 사용하는걸로 보이네요. 원리를 아실 필요는 없을 것 같습니다.

연관 노트 서칭
연관 노트 서칭

2-2. 챗봇 활용

gpt를 연결해뒀기 때문에 옵시디언에서 바로 챗봇을 이용(gpt3.5모델)할 수 있는데요. 임베딩도 해뒀기 때문에 "내 노트에 기반한 내용 요약해줘", "목차 구성해줘", "회의록 작성해줘" 등 활용할 수 있습니다. 저는 제가 가진 노트를 기반으로 글을 써달라고 요청해보도록 하겠습니다.

챗봇으로 활용하기
챗봇으로 활용하기

속도는 조금 느린 편이나 아래와 같이 대답을 잘 해줍니다.

챗봇으로 활용하기2
챗봇으로 활용하기2

아래는 GPT가 만들어준 전문입니다.

 

"행복의 정의
청소년의 행복에 대해 이야기하기 전에, 먼저 행복의 정의에 대해 알아보겠습니다. 행복은 개인마다 다르게 느껴지는 감정이지만, 일반적으로는 삶에 대한 만족과 긍정적인 감정을 느끼는 상태를 의미합니다. 행복은 단순히 쾌락이나 재화의 축적에 의해 결정되는 것이 아니라, 내적인 만족과 성취감, 사회적 관계의 만족 등 다양한 요소에 의해 영향을 받습니다.
행복의 요인
청소년들이 행복을 느끼는 요인은 다양합니다. 첫째로, 가족과의 관계는 매우 중요합니다. 가정환경이 안정적이고 지지를 받을 수 있는 가족은 청소년들에게 큰 행복을 선사합니다. 둘째로, 친구와의 관계도 행복에 영향을 미칩니다. 좋은 친구들과 함께하는 시간은 즐거움과 지지를 주고, 사회적 연결성을 높여줍니다. 또한, 자기 자신에 대한 긍정적인 자아개념과 자기효능감도 행복을 느끼는 데 중요한 요소입니다.
행복을 찾는 여정
행복을 찾는 여정은 모두에게 다양한 도전과 과정을 요구합니다. 청소년들은 자신의 가치와 관심사를 발견하고, 그에 따라 목표를 설정하고 노력해야 합니다. 자신의 열정과 재능을 발휘할 수 있는 활동을 찾는 것이 중요합니다. 또한, 자기 자신과의 관계를 발전시키고, 긍정적인 마인드셋을 갖추는 것도 행복을 찾는 여정에서 중요한 요소입니다. 마지막으로, 행복을 찾는 여정은 실패와 어려움을 포함합니다. 그러나 이러한 경험들을 통해 성장하고, 자신의 강점과 약점을 알아가며 더욱 강해질 수 있습니다.
결론
청소년들의 행복은 다양한 요인에 의해 결정되며, 행복을 찾는 여정은 개인마다 다를 수 있습니다. 그러나 가족과의 관계, 친구와의 관계, 자기 자신에 대한 긍정적인 자아개념과 자기효능감은 모두에게 중요한 요소입니다. 또한, 자신의 가치와 관심사를 발견하고, 목표를 설정하고 노력하는 것도 행복을 찾는 여정에서 중요합니다. 마지막으로, 실패와 어려움을 극복하며 성장하는 과정은 행복을 더욱 귀중하게 만들어줍니다. 청소년들은 자신의 행복을 위해 이러한 여정을 적극적으로 추구해야 합니다."

 

그럴 듯하게 글을 잘 작성해주는데요. 그런데 제 노트의 글을 기반으로는 작성해주지 않았습니다. 그래서 비교를 위해서 GPT3.5에 직접 노트 원문을 다 던져서 똑같이 명령을 해봤는데요. 그래도 결과는 아래 처럼 똑같이 나왔습니다.

GPT 테스트
GPT 테스트

아무래도 모델 문제 같습니다. 저는 업무, 개인 연구 때문에 GPT, 바드를 많이 활용하고 있는데요. 실제 제가 사용할 때도 3.5 모델은 텍스트를 길게 던질 경우 읽지 않고 대답을 생성하는 현상을 보입니다. 3.5 모델에 입력될 수 있는 토큰의 한계 때문에 그런 것 같습니다. 그래서 3.5 모델 말고 4.0 모델로 한 번 생성해보도록 하겠습니다.

 

smart connections 설정으로 가서 gpt4 모델 중 토큰 수를 가장 많이 먹는 128k 모델로 해보겠습니다.

모델 바꾸기
모델 바꾸기 설정

 

똑같은 질문을 던졌을 때 GPT 4.0 128k 모델에서는 아래와 같이 답을 줍니다.

 

"청소년의 행복에 대한 글을 작성하는 것은 매우 의미 있는 작업입니다. [[행복의 기원]]과 [[행복의 정복]]의 내용을 바탕으로, 청소년의 행복에 관한 글의 목차에 따라 내용을 구성해보겠습니다.
### 1. 행복의 정의
행복은 개인의 내면적 만족감과 긍정적인 감정 상태를 의미합니다. [[행복의 기원]]에서는 행복이 단순히 외부 조건에 의해 결정되는 것이 아니라, 개인의 태도와 내면의 평화로부터 비롯된다고 설명합니다. 이는 청소년들이 자신의 내면을 탐색하고 긍정적인 자아상을 형성하는 과정에서 행복을 찾을 수 있음을 시사합니다.
### 2. 행복의 요인
행복의 요인은 개인마다 다를 수 있으나, 일반적으로 인간관계, 성취감, 자아실현 등이 중요한 역할을 합니다. [[행복의 정복]]에서는 이러한 요인들이 어떻게 개인의 행복에 기여하는지를 탐구합니다. 특히 청소년기에는 친구들과의 관계, 학교 생활에서의 성취, 자신의 취미나 관심사에 대한 탐구 등이 행복감을 높이는 중요한 요소가 됩니다.
### 3. 행복을 찾는 여정
행복을 찾는 여정은 자기 자신과의 대화와 자기 이해에서 시작됩니다. [[행복의 기원]]에서는 자신의 내면을 이해하고 수용하는 과정이 행복으로 가는 첫걸음임을 강조합니다. 이어서 [[행복의 정복]]에서는 목표 설정, 긍정적 사고, 감사의 태도 등 행복을 향한 구체적인 전략들을 제시합니다. 청소년들에게는 자신의 감정과 생각을 이해하고, 자신만의 행복을 정의하며, 이를 실현하기 위한 노력이 중요합니다.
### 4. 결론
행복은 외부적 성공이나 물질적 조건에 의해서만 결정되는 것이 아닙니다. [[행복의 기원]]과 [[행복의 정복]]을 통해 볼 때, 행복은 자기 자신과의 관계, 긍정적인 생각과 태도, 그리고 자신의 삶에 대한 깊은 이해에서 비롯됩니다. 청소년기는 자신의 정체성을 찾고, 인생에서 중요한 가치를 발견하는 중요한 시기입니다. 이 시기에 행복의 진정한 의미를 탐색하고, 자신만의 행복을 찾아가는 여정은 매우 가치 있는 경험이 될 것입니다.
이 글이 청소년들이 자신의 행복을 탐색하고, 그 여정에서 의미와 만족을 발검하는 데 도움이 되기를 바랍니다."

 

차이점이 보이시나요? 128k의 토큰을 읽을 수 있기 때문에 노트들의 내용을 제대로 읽었고, 노트들이 마크다운 형태로 작성되었다는 것도 인식해서 답변 또한 마크다운 형태로 해줍니다. 내용도 제가 작성한 노트들의 내용 기반으로 제대로 작성되어 있습니다.

 

3. 발생 비용

아마도 비용이 가장 궁금할 수 있습니다. 대형 언어 모델의 비용 산정은 토큰을 기준으로 하는데요. 구체적인 산정 방식은 아실 필요 없지만, 간단하게 정리하자면 "개인이 사용하기에는 부담 없는 금액이다"란 것입니다.

아래는 오늘 테스트 하면서 사용한 금액인데요. 0.13 달러가 들었네요. 임베딩 하는데 0.01이 들었고, 프롬프트를 날리는데 0.13이 들었습니다. GPT 4 모델과 GPT 3.5 모델이 차이가 얼마 안 나는 걸 볼 수 있느데요. 사실 GPT 4 모델은 GPT 3.5 모델에 비해 결과물을 내주는데 0.001(1k 토큰 당) 정도만 높기 때문에 거의 차이가 없습니다. 토큰의 개념과 비용 산정에 관련해서는 나중에 게시글을 추가하도록 하겠습니다.

모델 바꾼 후 비용
모델 바꾼 후 비용


smart connections 기능을 이용해봤는데요. 정리하자면 아래와 같습니다. 

1. smart connections를 이용해 GPT 4.0 128k 모델을 이용하면 노트들을 읽어서 결과물을 잘 만들어준다.

2. GPT 3.5 모델은 토큰 수 제한으로 인해 노트를 못 읽을 가능성이 높다(웹에서 사용하는 GPT 3.5와 동일한 결과물을 준다)

3. 비용은 얼마 들지 않는다. 부담 되지 않는 가격이니 마음대로 써도 괜찮을 것 같다.

4. 혹시 나는 절대로 돈을 쓰기 싫다. 하는 사람은 smart connections의 노트 서칭 기능만 써도 될 것 같다.(임베딩 비용만 발생하며 임베딩 비용은 거의 들지 않는다. GPT API 키 등록 시 무료로 5달러를 주는데 이걸로 충분히 가능함)

 

반응형
반응형

https://www.youtube.com/watch?v=J7x0E0hLaJ8

온디바이스AI에 대해서 들어보셨나요? 외부 환경을 거치지 않고 기기에서 바로(on-device) 작동하는 AI를 말합니다. GPT는 사용자가 요청을 보낼 시 GPT 서버에서 요청을 처리 후 사용자에게 답변을 보내죠. 이와 같이 다른 외부 환경(서버)를 거치지 않고 기기 내부에서 바로 처리되어서 결과가 나오는 것을 말합니다.

삼성에서 S24를 공개했습니다. 온디바이스 AI를 강점으로 야심차게 내놓은 제품인데 온디바이스 AI로 무엇을 할 수 있는지 알아보겠습니다.


실시간 통역 및 번역, 서클 투 서치, 노트 어시스트, 음성 녹음 개선, 카메라 성능 업그레이드, 갤러리 앱 편집 기능 크게 6가지 기능으로 구성되어 있습니다.

 

1. 실시간 통역 및 번역

다른 언어를 사용하는 사용자 간 통화 시 실시간으로 양방향 통역하는 서비스를 제공합니다. 이 중 실시간 번역은 13개 언어를 지원한다고 하는데요. 13개 언어의 리스트는 아래의 이미지와 같습니다.

실시간 번역을 하는 보면 장면을 보면 아래와 같은데요. 사용자가 타 언어로 받을 경우 메시지의 바로 아래에 번역본을 보여주는 형태로 구현되는 것으로 보입니다.

2. 서클 투 서치(circle to search)

서클 투 서치는 어떤 곳에서든 원을 그리면 서칭을 할 수 있는 기능입니다. 서칭은 구글이 개발한 멀티모달 AI 제미니 모델을 기반으로 이뤄지게 됩니다.

검색을 하면 아래와 같이 비슷한 상품을 추천해주기도 하고요. 정보를 검색할 수도 있습니다. 이 기능은 사실 원래 있던 기능이죠? 다들 네이버에서 많이 써보셨을건데 이미지 검색 기능입니다. 원래 구글에도 있던 기능이기도 해서 딱히 신기하지는 않네요. 

 

3. 노트 어시스트

노트 어시스트에서는 메모 등을 사용할 경우 AI가 문서를 요약, 편집 등을 해주는 기능입니다. 아래를 보면 바로 이해가 되실 겁니다. 왼쪽이 사용자 입력 메모인데 이를 회의록 형태로 바꿔달라고 요청하면 AI가 자동으로 회의록을 작성해줍니다.

4. 음성 녹음 개선

음성 녹음 앱으로 회의나 강의를 녹음할 경우 STT(Speech-to-text) 라는 기술을 이용해 최대 10명까지의 화자를 구분해서 스크립트를 제공합니다. 평소 업무 회의를 녹음하시는 분들 같은 경우 이 기능이 유용하게 쓰일 것 같네요.

 

5. 카메라 성능 업그레이드

AI기반의 프로비주얼 엔진이란 것을 통해 줌 기능부터 나이토그래피까지 더 안정된 화질을 제공합니다.

 

6. 갤러리 앱 편집 기능

갤러리 앱 편집 기능은 AI를 이용해 사진을 편집하는 기능입니다. 사실 이 기능도 이미 웹과 앱으로 많이 제공되고 있는 기능이라 딱히 신기하지는 않네요. 다른 앱을 통하지 않고 내 디바이스에서 바로 할 수 있다는 장점만 있습니다. 아래의 예시처럼 왼쪽의 이미지를 오른쪽 이미지 처럼 자유롭게 변경 가능합니다. 

소개드린 기능 외에도 안드로이드 오토 등 다른 AI 기능들도 많으니 최상단에 있는 링크로 들어가셔서 구경하시면 될 것 같습니다.


전체적으로 예상했던 대로의 기능이 나왔네요. 새롭지는 않고 이미 제공되고 있던 기능을 내 디바이스에서 수행할 수 있다는 장점 밖에 없는 것 같습니다. 이 기능들이 필요한 사람들에게는 좋을 것 같으나, 이 기능 때문에 굳이 S24로 변경할 것 같지는 않네요. 

애플도 최근 페럿 관련 보도들이 다수 나오고 있는데요. 애플도 온디바이스 AI를 곧 선보일 것으로 예상됩니다만... 과연 애플이라도 혁신적인 기능을 보일 수 있을까?에 대해서는 회의적입니다. 이미 나올 수 있는 기능은 대부분 나와있는게 현실이기 때문이죠. 애플에서 나오는 온디바이스 AI도 갤럭시에서 이번에 나온 기능들 처럼 기존 기능들을 가져다가 편하게 쓸 수 있는 수준으로 제공할 것 같습니다. 물론 애플은 반강제적으로 아이클라우드를 쓸 수밖에 없어서, 여러 기기들 간의 연동을 위해 AI를 사용하는 등의 기능을 추가적으로 더 제공할 것 같습니다. 

누군가는 기존 쓰던 것을 편리하게 제공하면 좋은거 아니야? 라고 말씀하실 수 있겠지만, 기업 입장에서는 매출이 가장 중요하고, 새로운 기능이 매출을 증대시킬 수 있느냐가 중요하죠. 그런데 지금 나온 내용들을 봤을 때 저거로 매출을 증대시킬 수 있냐? 라고 한다면 의문이 듭니다. 

애플 비전 프로 글에서도 적었지만 제 생각에 스마트폰으로 할 수 있는 혁신을 이미 거의 모두 진행된 것으로 생각됩니다.스마트폰 다음 주류 디바이스가 어떤 것이 될지에 대해서 논하는게 더 투자에 도움이 되지 않을까 합니다. 

 

요약: 온디바이스 AI는 예상되는 수준으로의 기능만 제공된다. 가면 갈수록 스마트폰으로 보여줄 수 있는 혁신은 끝난 것으로 보이며, 스마트폰 다음 주류 디바이스 모델을 기다리는 것이 좋을 것 같다.

 

함께 보면 좋은 글) 갤럭시AI가 적용되는 갤럭시링

반응형
반응형

미국 대표 신문사 하면 어디가 떠오르나요? 저는 뉴욕타임즈가 떠오르는데요. 뉴욕타임즈는 미국의 대표적인 일간지로 1851년 9월에 창간되었습니다. NYT라고도 부르는 뉴욕타임즈는 온라인 저널리즘으로 성공적인 비즈니스 모델을 구축한 소수 언론 매체 중 하나인데요. 최근 뉴욕타임즈에서 마이크로소프트와 오픈AI에 생성형 AI 학습에 자신들의 기사를 무단으로 사용했다는 저작권 소송을 걸었습니다.


ChatGPT와 기타 인기 있는 AI 플랫폼을 개발한 회사들을 상대로 뉴욕타임즈가 미국에서 청므으로 소송을 제기한 것으로, 뉴욕 연방 지방 법원에 제기되었는데요. 소송 내용에는 뉴욕 타임즈의 수백만 건 기사가 자동 챗봇 훈련에 사용되었다고 주장하며, 이로 인한 수십억 달러에 이르는 법적 및 실질적 손해를 입었으며, 이에 대한 책임을 물을 것을 요구하고 있습니다. 일단 표면적으로는 "우리의 저작물에 저작권 침해를 했으니 손해 배상해라"로 보이는데, 뉴욕타임즈는 ChatGPT와 같은 생성형 AI를 앞으로의 뉴스 산업에서의 경쟁 상대로 생각하고 이미 견제를 들어가는 것으로 보입니다. AI 기자는 이미 과거부터 논란이 되어 왔고, AI 기자가 생성한 기사와 실제 기자가 생성한 기사를 비교하는 실험들도 종종 보도되었었죠. 아마 뉴욕타임즈는 미래에는 이런 생성형 AI가 자신들의 매출에 영향을 줄 것이라고 보고 있는 것 같습니다. 
여기서 의문인 건 왜 구글의 바드는 안 건들지라는 것인데요. 관련해서 찾아보면 이번 소송이 지난 4월부터 양측이 진행해 온 콘텐츠 사용료 지불 계약 협상이 결렬되면서 나왔다고 하는데, 아마 구글과는 이 협상을 아직 진행하지 않았거나(계약 기간이 남아서), 협상이 잘 되었거나 둘 중 하나인 것으로 보입니다. 즉 마이크로소프트와 오픈AI한테 협상 결렬된 것에 대한 불만 표출도 있는 것 같아요. 

소송 결과는 과연 어떻게 될까요? 2022년에 미 항소법원에서 "인터넷 공개 정보, 자동 스크래핑은 합법"이라는 판결이 났었는데요. 과거 링크드인이 하이큐 랩스에 대해 사용자 개인 정보를 스크래핑 하는 것을 막기 위해 제기한 법적 소송에 대한 판결입니다. 저작권이 있는 기사와 개인정보 조금 성격이 다르긴 하지만, 더 민감한 정보인 개인정보에 대해서 외부 공개되었다는 이유로 합법으로 판결된 것을 보면, 저작권이 있는 저작물도 동일한 판결이 내려질 가능성이 높지 않을까? 생각되긴 하네요.


이번 소송이 중요한 것은 생성형 AI의 대표 주자인 오픈AI의 ChatGPT와 그를 후원하고 있는 마이크로소프트에 대한 소송이란 점입니다. 아마 이런 대표주자들한테 들어간 소송이 뉴욕타임즈의 승리로 끝난다면 AI란 학습을 기반으로 돌아가는 시스템이기 때문에 생성형 AI 자체에도 큰 영향을 줄 수 있을 것으로 보입니다.

반응형
반응형

미국에서 가장 오랜된 사전 출판사인 ‘메리엄-웹스터’가 올해의 단어로 ‘진짜(Authentic)’을 선정했다고 해서 관련한 저의 생각을 적어봅니다.

https://www.merriam-webster.com/wordplay/word-of-the-year

 

Word of the Year 2023

'Authentic,' plus 'rizz,' 'deepfake,' 'coronation,' and other words that defined the year

www.merriam-webster.com

 

간단 내용 요약


  • 메리엄-웹스터에서는 올해의 단어로 '진짜(Authentic)'를 선정한 이유로 “AI와 소셜미디어(에서 일어난 논란)로 이 단어의 검색량이 크게 증가했다”고 선정 배경을 설명함
    • A high-volume lookup most years, authentic saw a substantial increase in 2023, driven by stories and conversations about AI, celebrity culture, identity, and social media
  •  “학생이 진짜로 이 논문을 썼는지, 딥페이크 등장, 유명인(연예인, 정치인 등)이 발언을 했는지 믿을 수 없게 됐으며, 소셜미디어와 마케팅 등 모든 면에서 진짜와 가짜 사이의 경계가 점점 흐려지고 있는 상황" 이라는 인터뷰를 함
    • And with the rise of artificial intelligence and its impact on deepfake videos, actors’ contracts, academic honesty, and a vast number of other topics the line between “real” and “fake” has become increasingly blurred
  • 그 외 'Rizz', 'Deepfake', 'Coronation', 'Dystopian' 등의 키워드가 있었음

 

생각


  • 1위로 선정된 단어 '진짜'에 대해 생각해보았음
  • 먼저 정의해야할 것은 "'진짜'란 무엇인가"
    •  "학생이 진짜로 이 논문을 썼는지, 정치인이 실제로 이 발언을 했는지 ... " 등의 기사 내용을 보았을 때, 여기서 말하는 '진짜'는 '정보'를 말하는 것임
    • 즉, 메리엄-웹스터에서는 올해의 단어로 Authentic(진짜 = 정보의 진실성 또는 신뢰성)을 뽑았다고 할 수 있음
  • 두 번째로 정의해야할 것은 "'진짜(정보의 진실성)'를 만들 수 있는 '주체'는 정해져있는가?"
    • 오직 '사람'만이 만든 것이 '진짜'인가? vs 'AI', '프로그램' 등으로 인해 만들어진 것도 '진짜'인가?
      • 후자에 동의함. 사람이 만들더라도 가짜인 정보는 무수히 많다는 점에서 AI나 프로그램이 만드는 그것에 비해 절대로 더 낫다고 할 수 없음
      • 사람들은 이야기를 전하면서 수많은 각색과 왜곡을 일으킴. GPT, Bard 등에서 일어나는 환각 현상과 유사
  • 세 번째로 정의해야 할 것은 "정보의 진실성이 보장되었다"고 인정할 수 있는 "'진짜'의 정도(범위)"
    • 100% AI, 프로그램이 만든 정보도 진짜인가?
      • 최소 30%는 사람의 손을 거쳐야(검수 등)한다
      • 최소 50%는 사람의 손을 거쳐야(검수 등)한다
      • 최소 70%는 사람의 손을 거쳐야(검수 등)한다
      • ...
  • 의견이 다양할 수 있으며, 사회적으로 이런 것에 대한 합의가 이뤄진 것이  없음
  • 단어의 의미는 사회 변화에 따라 변하는 것임. 메리엄-웹스터에서는 지금까지 '진짜'를 만드는 주체가 사람이라는 가정하에 이 논의를 꺼냈지만, 기술의 발전 속도로 보았을 때 '진짜'라는 단어가 의미하는 주체의 범주는 '사람'에서 'AI'로 확장될 것
반응형

+ Recent posts