미국 대표 신문사 하면 어디가 떠오르나요? 저는 뉴욕타임즈가 떠오르는데요. 뉴욕타임즈는 미국의 대표적인 일간지로 1851년 9월에 창간되었습니다. NYT라고도 부르는 뉴욕타임즈는 온라인 저널리즘으로 성공적인 비즈니스 모델을 구축한 소수 언론 매체 중 하나인데요. 최근 뉴욕타임즈에서 마이크로소프트와 오픈AI에 생성형 AI 학습에 자신들의 기사를 무단으로 사용했다는 저작권 소송을 걸었습니다.
ChatGPT와 기타 인기 있는 AI 플랫폼을 개발한 회사들을 상대로 뉴욕타임즈가 미국에서 청므으로 소송을 제기한 것으로, 뉴욕 연방 지방 법원에 제기되었는데요. 소송 내용에는 뉴욕 타임즈의 수백만 건 기사가 자동 챗봇 훈련에 사용되었다고 주장하며, 이로 인한 수십억 달러에 이르는 법적 및 실질적 손해를 입었으며, 이에 대한 책임을 물을 것을 요구하고 있습니다. 일단 표면적으로는 "우리의 저작물에 저작권 침해를 했으니 손해 배상해라"로 보이는데, 뉴욕타임즈는 ChatGPT와 같은 생성형 AI를 앞으로의 뉴스 산업에서의 경쟁 상대로 생각하고 이미 견제를 들어가는 것으로 보입니다. AI 기자는 이미 과거부터 논란이 되어 왔고, AI 기자가 생성한 기사와 실제 기자가 생성한 기사를 비교하는 실험들도 종종 보도되었었죠. 아마 뉴욕타임즈는 미래에는 이런 생성형 AI가 자신들의 매출에 영향을 줄 것이라고 보고 있는 것 같습니다. 여기서 의문인 건 왜 구글의 바드는 안 건들지라는 것인데요. 관련해서 찾아보면 이번 소송이 지난 4월부터 양측이 진행해 온 콘텐츠 사용료 지불 계약 협상이 결렬되면서 나왔다고 하는데, 아마 구글과는 이 협상을 아직 진행하지 않았거나(계약 기간이 남아서), 협상이 잘 되었거나 둘 중 하나인 것으로 보입니다. 즉 마이크로소프트와 오픈AI한테 협상 결렬된 것에 대한 불만 표출도 있는 것 같아요.
소송 결과는 과연 어떻게 될까요? 2022년에 미 항소법원에서 "인터넷 공개 정보, 자동 스크래핑은 합법"이라는 판결이 났었는데요. 과거 링크드인이 하이큐 랩스에 대해 사용자 개인 정보를 스크래핑 하는 것을 막기 위해 제기한 법적 소송에 대한 판결입니다. 저작권이 있는 기사와 개인정보 조금 성격이 다르긴 하지만, 더 민감한 정보인 개인정보에 대해서 외부 공개되었다는 이유로 합법으로 판결된 것을 보면, 저작권이 있는 저작물도 동일한 판결이 내려질 가능성이 높지 않을까? 생각되긴 하네요.
이번 소송이 중요한 것은 생성형 AI의 대표 주자인 오픈AI의 ChatGPT와 그를 후원하고 있는 마이크로소프트에 대한 소송이란 점입니다. 아마 이런 대표주자들한테 들어간 소송이 뉴욕타임즈의 승리로 끝난다면 AI란 학습을 기반으로 돌아가는 시스템이기 때문에 생성형 AI 자체에도 큰 영향을 줄 수 있을 것으로 보입니다.
이틀 전에 구글 서치 콘솔 등록을 위한 글을 올렸었습니다. 오늘 오전에 확인해보니 정상적으로 등록이 되어서, 등록이 정상적으로 되면 어떤 식으로 화면이 나타나는지 글을 올려봅니다.
원래는 비어있던 실적, 색인생성 부분에 그래프가 생성되어 있는 것을 확인할 수 있습니다. 색인생성 부분에 보면 색인이 생성되지 않은 페이지 62개, 색인이 생성된 페이지 19개라고 나타나네요. 근데 제가 쓴 글은 전체 약 30개 정도 되는데 색인이 왜 이렇게 많이 생성되어 있는지는 잘 모르겠네요. 어쨌든 생성되지 않은 페이지는 어떤 문제로 생성이 되지 않은지 확인이 필요해보여 확인해봤습니다.
페이지 메뉴에 가면 확인할 수 있는데요. 스크롤을 아래로 내려보시면 상세 정보를 확인할 수 있습니다.
페이지 색인이 생성되지 않은 이유라고 여러 항목들이 뜨는데요. 여기서 아래의 "발견됨", "크롤링됨" 부분은 시간이 지나면 될 것으로 보이는 페이지에요. 그래서 두 항목은 따로 확인하지 않았고요. 위의 4가지에 대해서 어떤 이유로 안 되었는지 자세히 확인해보았습니다. 확인해보는 방법은 각 항목을 클릭하면 상세하게 어떤 페이지에서 해당 사유로 색인이 생성되지 않은지 확인할 수 있습니다. 예를 들어 제일 위의 항목인 "적절한 표준 태그가 포함된 대체 페이지"를 클릭하면 아래와 같이 페이지 리스트를 확인할 수 있습니다.
이렇게 각 사유에 들어가서 페이지를 확인해주시면 되는데요. 위에서 나타난 4가지 사유에 대해서 나타난 이유와 어떤 조치를 취해야하는지 알아보겠습니다.
1. 적절한 표준 태그가 포함된 대체 페이지: 이 페이지는 다른 페이지의 대체로 표시되는 페이지입니다(모바일 또는 모바일의 표준 등). 이 페이지는 색인이 생성된 표준 페이지로 올바르게 연결되므로 별도의 조치를 취할 필요가 없습니다.
2. 리디렉션이 포함된 페이지: 리디렉션이란 클라이언트(브라우저 또는 검색 엔진)가 요청한 웹 페이지의 URL이 다른 URL로 변경되어 해당 페이지로 이동하는 것을 말합니다. 즉 어떤 페이지로 이동하기 위한 페이지로 볼 수 있습니다. 리디렉션이 포함된 페이지를 눌러서 링크를 확인해보면 아래와 같이 카테고리가 되어 있을 겁니다.
카테고리는 게시물이 아니고 게시물로 이동하기 위한 다리 역할을 하는 곳이죠? 그리고 구글에서 검색했을 때 노출이 안 되는게 정상이므로 이 부분도 별도 조치 필요 없습니다.
3. 찾을 수 없음(404): 명시적 요청이나 사이트맵이 없는데 Google에서 URL을 발견한 경우, 이전에 존재했지만 삭제된 페이지일 수 있습니다. 해당 경우도 검색에 필요없는 페이지일 수 있습니다. 그래도 확인을 위해서 한 번 알아보겠습니다.
찾을 수 없음(404) 사유를 클릭해서 이동합니다.
url을 클릭합니다. 저 같은 경우는 tag 페이지라고 뜨는데요. 딱 봐도 게시물이 아닌 것 같죠?
이런 태그 페이지가 뜹니다. 이 경우도 2번 리디렉션이랑 비슷한 경우로 게시물이 아니기에 구글에서 색인을 걸러낸 것으로 보입니다. 그래도 혹시 모르니 404 오류 같은 경우는 한 번쯤 확인해보는게 좋을 것 같습니다.
4. robots.txt에 의해 차단됨: robots.txt란 크롤링을 하는데 사용되는 규약을 의미합니다. 크롤링이란 웹 페이지의 내용을 긁어오는 것인데요. 지금 저희가 하고 있는게 우리가 쓴 글을 구글이 긁어와서 구글의 검색 엔진에 보여주는 것(크롤링)이잖아요? 이러한 규약을 의미한다고 할 수 있습니다. 그리고 해당 오류는 이러한 규약에 의해 차단되었다는 것을 의미하고요. 그래서 이 사유에 해당하는 사이트도 한 번 확인해봤습니다. 3번과 동일한 과정으로 확인해주시면 되는데요.
확인을 해보니 guestbook(방명록) 페이지였고, 방명록은 검색될 필요가 없기 때문에 robots.txt 규약에 disallow로 미리 지정이 되어 있어서 크롤링이 되지 않은 것으로 판단됩니다. 그래도 4번 같은 경우도 혹시 정상적인 게시물을 올린 페이지가 안 올라와 있을 수 있기 때문에 한 번쯤 확인해보는게 좋을 것 같습니다.
그리고 RSS 같은 경우도 처음에 올렸을 때는 실패? 였나 그런 문구가 떴던 것으로 기억하는데요. 지금 보니 정상적으로 "성공" 상태로 바뀐 것으로 확인할 수 있습니다.
이렇게 구글 서치 콘솔 등록이 제대로 되었는지, 색인 생성 오류는 왜 생겼는지, 어떻게 대처해야하는지 알아봤습니다. 네이버는 아직 반응이 없어서 나중에 반응이 올라오면 또 글을 올리도록 하겠습니다.
최근 영국 경제경영연구소(CEBR)에서 공개한 '세계경제순위표 2024'에는 2038년에는 GDP 기준으로 최대 경제 대국이 중국이 될 것(중국-미국-인도-일본-독일-영국 ... 순)이라는 소식들이 보도되었습니다. 중국에 대해 제가 들은 소식들은 코로나 이후 '부동산이 힘들다', '경제가 힘들다', '말도 안되는 게임 규제' 등의 소식이 있었는데, 제가 예측하는 것과는 조금 다른 보도라서 의외긴 했습니다. 그래서 최근에 중국과 관련해서 나오고 있는 4가지 중요 소식들 정리를 해보았습니다.
출산율
구글에서 검색했을 때 나오는 2020년 세계은행 출처 자료를 보았을 때의 중국 출산율은 1.28입니다. 현재의 대한민국 보다는 훨씬 양호한 것으로 보이는데요. 최근 발표에 따르면 작년 중국 합계 출산율은 1.09명으로 떨어질 것으로 보인다고 합니다. 2015~2016년 경 중국은 한 자녀 정책을 폐지하고 두 자녀 정책을 도입했습니다. 2016년에 대한민국과 일본이 역대 최저수준의 출생아 수를 보인 반면, 중국은 2016년에 두 자녀 정책 도입 효과로 지난해 대비 130만 명 넘게 출생아가 늘어나는 효과를 보였습니다. 근데 2017년 소폭 감소하기 시작하더니 2018년 출생아 수가 전년 대비 200만 명이나 폭락하면서 두 자녀 정책의 효과가 반짝효과로 끝나버렸죠. 그렇게 쭉쭉 감소를 하더니 2021년에는 건국 이래 최저 출생아 수인 10,620,000명 기록, 2022년에는 1000만 명이 깨져버렸습니다. 출산율은 경제, 국방, 소비 등 국가의 경쟁력에서 아주 중요한 요소죠. 이렇게 출산율이 감소하는 추세로 돌아섰다는 것은 이미 중국 젊은 세대의 결혼과 출산에 대한 인식이 바뀌었다는 것을 보여주는데, 그런 추세를 과연 바꿀 수 있을까요? 저는 불가능하다고 보고, 그래서 출산율 부문에서 보았을 때 2038년 CEBR의 판단은 동의할 수 없었습니다. 2020년 코로나 팬데믹 이후 중국의 코로나에 대한 대처도 옳지 못했죠. 그래서 최근 발표된 GDP대비 비중 주요국 민간소비 비중을 보면 중국은 다른 경쟁국들 대비 현저히 낮은 수치를 보이고 있습니다. 아직 출산율 저하가 중국 경제에 영향을 미치는 본격적인 시기가 아닌데도(보통 출산율이 떨어지면 해당 출생 세대들이 본격적으로 소비 주체가 될 때부터 영향을 준다고 봄) 이런 상황이란 건 중국 경제가 심각하다는 것을 보여주죠
부동산
부동산은 2000년대부터 중국 경제의 주된 서장동력이였습니다. 한국과 유사하죠? 하지만 너무 부동산 쪽으로 과잉투자가 지속되다 보니 부채 누적 증가, 자원 배분의 비효율성 증가 등 여러 무제가 생기면서 경제 성장에 주는 긍정적 영향보다는 부정적 영향이 부각되기 시작했습니다. 그 부정적 효과를 보여주는 가장 최근의 사례가 2021년 헝다그룹 파산 위기 사태입니다.
2021년 9월 헝다그룹이 부채 이자를 갚지 못해 곧 디폴트를 선언할 것이라는 블룸버그발 뉴스가 있었습니다. 그 후 주가의 등락을 반복, 홍콩증권거래소에서 거래 정지, 12월에는 홍콩 항셍지수에서의 퇴출 등 여러 진행 과정이 나타나다가 최근 2023년 8월에는 미국 뉴욕 파산법원에 파산보호신청을 하기 까지 이르렀습니다. 헝다 그룹 파산 사태가 일어난 원인으로는 헝다그룹은 문어발식으로 사업을 확장하는 중이었는데, 2020년 일어난 코로나 팬데믹으로 인해 중국 정부는 부동산 개발업제 대출 규제를 했고, 이에 따라 헝다는 자금난에 빠져 파산 위기에 쳐했었습니다. 위의 헝다그룹 사태에서 보았듯이, 소위 부동산으로 경제를 부흥시키는 것은 개발도상국의 초기 경제 급성장에는 괜찮지만 시간이 갈수록 부작용이 일어나기 마련인데요. 중국 정부에서도 이런 부동산 위기를 극복하기 위해 2010년대 후반부터 부동산 부문 부채 위험을 감소시키기 위한 디레버리징(deleveraging)을 추진하고 있습니다. 다만 최근 헝다 위기와 같은 부동산 경기의 급격한 위기가 일어나서, 이에 대응하기 위해 중앙 정부 차원의 공급확대를 하게 되고, 이런 자금 지원은 부동산 부문의 디레버리징을 지연시키는 측면이 있기 때문에 현재 부정적인 굴레에 빠져있는 상태입니다.
게임 규제(신뢰성)
"게임 산업이 중국에서 큰 것은 맞지만 중국 전체 경제의 한 부분을 담당할 정도로 큰 의미가 있냐?"라는 의문을 가지신 분들도 있을 것 같습니다. 근데 사실 이 부분은 중국 내 주요 산업에 대한 신뢰성과 큰 연관성이 있습니다. 중국의 게임에 대한 규제는 과거에도 있어 왔습니다. 2018년 1월 중국의 대규모 게임규제 발표, 2020년 4월 코로나 팬데믹 이후 전염병, 좀비, 종말 같은 소재를 못 다루게 하는 규제, 2020년 경 18세 미만은 게임이용이 전면 금지된다는 소식 등 여러 규제나 소식들이 있었죠. 이 중 실제로 이뤄진 것도 있지만 안 이뤄진 것들도 있는데요. 최근에는 2024년에 실제로 이뤄지는 규제들에 대한 발표가 있어서 게임 관련 회사들의 주가들이 말 그대로 떡락을 하면서 이슈가 되었습니다.
주요 규제 내용은 월정액 금지, 배틀 패스 금지, 일일 퀘스트 금지, 출석체크 금지, 유저간 거래 금지, 10연 뽑기 금지, 경매장 금지, 미성년자 가챠 금지, 플레이어 강제 공격 금지 등이 있는데요. 너무 많아서 요약해보자면 1. 매일 게임에 접속하게 하는 시스템 금지 2. 경쟁을 일으킬 수 있는 요소 금지 3. 미성년자 과금 제한으로 요약할 수 있습니다. 게임 산업에 대해 잘 모르시는 분들은 "이게 그렇게 큰 영향을 줄 요소인가?"라고 생각하실 수 있겠지만, 해당 내용들은 최근 게임사들이 주로 취하고 있는 비즈니스 모델, 수익 구조를 완전 금지시키는 것이라서 게임 업계에는 아주 큰 영향을 준다고 할 수 있습니다. 모바일, PC 게임에서는 유저들이 지속적으로 게임에 접속해서 과금을 유도하기 위해 일명 숙제라고 하는 출석 시스템, 배틀 패스 시스템, 일일퀘스트 시스템 등을 활용하는데 이것을 금지시킨 것이죠. 중국의 기업들 솔직히 얘기하면 큰 기업들, 대단한 기업들 많잖아요? 기술 훔쳐간다 뭐 이런 얘기하시는 분들도 있는데, 원가 절감이라는 이점과 노동력을 기반으로 좋은 제품들 만드는 것도 사실이고, 최근에는 기술력도 올라오고 있죠. 그런데 위와 같은 게임 규제 사태를 보았을 때, 기업 위에 정부가 있기 때문에 언제든 정부 마음대로 기업을 반토막 낼 수 있고, 이는 주주들에게 큰 투자 반감 요소로 다가오게 됩니다. 그래서 저도 중국 기업에는 투자를 하지 않고 있고요. 이런 중국 내 주요 산업 신뢰성에 대한 부정적인 감정은 중국이 추후 성장하는데도 큰 걸림돌이 될 것이라 생각합니다.
성장 구조 변화
지금까지는 부정적인 부분들 뿐이었지만, 중국 성장과 관련해서 긍정적인 부분도 있는데요. 중국은 2010년대 중반부터 중국제조 2025 등 여러 제조업 고도화를 위한 정책을 추진해왔습니다. 기존 산업(섬유, 의류, 컴퓨터 등)은 축소되었지만, 전기차와 이차전지, 태양광 등 신성장 산업은 빠르게 성장하고 있죠. 테슬라와 전기차 투자에 관심이 있는 분들은 당연히 중국 전기차에 대해서도 들어봤을 겁니다. 준수한 자동차 성능, 엄청난 가격 경쟁력, 중국 내에서의 인지도로 인해 실제로 판매도 잘 되고 있고, 수출도 잘 되고 있습니다.
그래프를 보면 2020년 이후부터 신성장 산업인 전기차, 이차전지, 태양광의 수출이 급증하고 있는 것을 볼 수 있죠. 태양광은 최근 신재생 에너지에 대한 여러 이슈, 전쟁 이슈 등으로 수출이 지지부진 하긴 하지만 이것은 중국만의 문제가 아니라 전세계적인 문제라서 크게 이상한 부분은 아니라고 판단됩니다. 어쨌든 전기차와 이차전지 부문에서 중국도 전세계적으로 어느정도 주도하고 있는 분위기고 이 부분은 강점으로 가져가면 중국 경제 성장에 큰 영향을 줄 수 있겠죠. 하지만 한편에서는 이런 신성장 산업 발전이 중국의 부동산과 같은 기존 산업을 대체할 정도의 성과를 내기에는 꽤 긴 시간이 소요될 것으로 보인다고 합니다. 제 개인적인 생각으로도 최소 십 년 이상은 봐야할 것 같고, 지금 당장 중국이 해당 분야에서 세계적으로 꽤 나간다고 해도 다른 경쟁국이나 기업들도 가만히 있는 것은 아니니까 이 지위를 유지할 수 있을지도 의문이고요. 솔직히 가격 경쟁력이 좋은거지 기술 경쟁력은 전통적인 자동차 강국인 독일이나, 일본, 미국 등이 최고인 것은 누구나 인정하죠. 그래서 성장구조 변화 부문에서도 그나마 긍정적이긴 하지만, 이 긍정적인 부분을 얼마나 길게 가져갈 수 있을지 의문이긴 해서 CEBR의 발표에 저는 그렇게 동의하지는 않습니다.
CEBR의 2038년 중국 GDP 기준 최대 경제대국 될 것이라는 발표에 대해, 출산율, 부동산, 게임규제(신뢰성), 성장 구조 변화 4부문에서 제 나름대로 정리해보았습니다. 결론적으로 저는 부정적으로 보고 있고요. 저 때도 1위는 미국 2위는 중국을 유지하고 있을 것 같습니다.
구글 서치 콘솔 등록하기에 이어서 네이버 웹마스터라고 네이버에도 노출을 도와주는 도구가 있더라고요. 구글 서치 콘솔이랑 차이는 뭔데? 라는 의문점이 있으실 수 있는데, 구글은 구글에서 제공하는 봇이 내 블로그 게시글을 크롤링해서 구글에 잘 노출되게 만들어주는 것이고, 네이버 서치 어드바이저는 네이버에서 제공하는 봇이 내 블로그 게시글을 크롤링해서 구글에 잘 노출되게 만들어주는 것입니다. 구글 서치 콘솔에 이어 네이버 서치 어드바이저도 제 블로그 등록겸 어떻게 등록하는지 간략하게 정리해봅니다.