GPT 효과: 고객 서비스의 새로운 시대

게시 됨: 2023-03-10

대규모 언어 모델을 사용한 최근의 혁신은 우리의 모든 기대를 뛰어넘었습니다. 업계 전문가를 모아 GPT에 대한 대화와 GPT가 고객 서비스의 미래를 형성하는 방법에 대해 이야기했습니다.

우리는 그것이 우리를 놀라게했다고 말할 수 없습니다. 수년 동안 업계에서는 특히 컴퓨팅 성능과 데이터 스토리지의 발전으로 점점 더 큰 모델을 교육할 수 있게 됨에 따라 AI와 기계 학습이 우리가 일하는 방식을 근본적으로 변화시킬 수 있는 가능성을 높이 평가해 왔습니다. 그러나 우리는 OpenAI의 ChatGPT의 최근 발전이 얼마나 빨리 새로운 가능성을 열어줄지 예상하지 못했습니다.

Intercom에서 우리는 항상 배우기 위해 출하했습니다. 새로운 기능을 신속하게 제공해야만 적절한 피드백을 받고, 이를 통해 배우고, 반복해서 반복하여 고객에게 더 나은 서비스를 제공할 수 있습니다. 그래서 당연히 이 새로운 기술로 우리가 한 일입니다. 지난 몇 달 동안 우리는 160명의 고객에게 몇 가지 AI 기반 기능을 제공했습니다. 그리고 이러한 대규모 언어 모델(LLM)이 우리 삶에서 어떻게 작용할지 말하기에는 아직 너무 이르지만, 특히 고객 서비스와 관련하여 중요한 변곡점에 도달했다고 믿습니다.

그래서 지난 주에 우리는 GPT의 비즈니스 사용 사례를 좀 더 깊이 파고드는 웨비나를 개최했습니다. 이 혁신의 물결은 과거의 물결과 다른가요? 우리가 일하는 방식과 기업이 고객 및 잠재 고객과 상호 작용하는 방식을 변화시킬까요? 새로운 세대의 신생 기업을 촉발시킬 수 있습니까? 더 많은 통찰력을 제공하기 위해 스타트업 업계의 거물 몇 명을 초대하여 의견을 나눴습니다.

오늘 에피소드에서는 다음과 같은 소식을 듣게 됩니다.

  • Ethan Kurzweil, Intercom 이사 및 Bessemer Venture Partners 파트너
  • Fergal Reid, 기계 학습 담당 이사
  • Krystal Hu, Reuters의 VC 및 스타트업 기자
  • Talia Goldberg, Bessemer Venture Partners의 파트너

그들은 ChatGPT와 같은 대규모 언어 모델, 기업이 이 기술을 통합하는 방법, 고객 서비스 산업의 미래를 형성하는 방법에 대해 이야기할 것입니다.

시간이 부족하십니까? 다음은 몇 가지 주요 내용입니다.

  • 우리는 대규모 언어 모델의 끈끈한 사용 사례를 보기 시작했습니다. 규칙성과 자연어 사용으로 인해 고객 서비스를 강화할 수 있는 큰 잠재력이 있습니다.
  • 현재로서는 대규모 언어 모델이 인간의 능력을 대체하는 것이 아니라 증강할 것으로 예상됩니다. 전문가가 업무를 보다 생산적이고 효율적으로 만드는 데 도움이 될 수 있기 때문입니다.
  • Intercom의 베타 실험의 성공을 측정하기에는 아직 너무 이르지만 최신 AI 기반 기능의 채택 및 사용은 엄청났으며 초기 피드백은 매우 유망합니다.
  • 대규모 언어 모델은 매우 빠르게 비용이 많이 들 수 있습니다. 그러나 시간이 지남에 따라 더 저렴해지고 보편화되어 더 많은 실험과 발견이 가능해질 것입니다.
  • 여전히 환각에 문제가 있지만 상황에 따라 더 높은 수준의 신뢰가 필요할 때 더 신뢰할 수 있도록 이러한 모델을 구성하고 제한할 수 있습니다.
  • 모델은 만능이 아닙니다. 미래에는 기업들이 서로 다른 비즈니스 문제에 적합한 서로 다른 사용자 정의 가능한 모델의 맞춤형 혼합을 실행할 가능성이 높습니다.

토론이 마음에 든다면 팟캐스트의 더 많은 에피소드를 확인하세요. Apple Podcasts, Spotify, YouTube를 팔로우하거나 선택한 플레이어에서 RSS 피드를 가져올 수 있습니다. 다음은 에피소드의 약간 편집된 대본입니다.


ChatGPT의 부상

Krystal Hu: 시간을 내어 함께 해주셔서 정말 감사합니다. 저는 Reuters의 벤처 및 스타트업을 담당하는 Krystal Hu입니다. 많은 분들이 아시다시피 지난 몇 달 동안 AI와 ChatGPT의 물결이 등장했습니다. 제 업무의 큰 부분은 기술과 그것이 삶의 다양한 측면을 어떻게 변화시키고 있는지 파악하는 것입니다. 오늘의 주제에서는 ChatGPT가 고객 서비스의 미래를 형성하는 방법에 초점을 맞출 것입니다. ChatGPT와 대규모 언어 모델이 정확히 무엇인지, 이 기술이 어떻게 사용될 것인지, 기존 기술과 미래 기술에 미칠 영향, 신생 기업이 이 기술을 통합하는 방법, 새로운 회사가 구축되는 방법에 대해 논의할 것입니다.

우리는 오늘 우리와 함께 훌륭한 패널을 가지고 있습니다. Bessemer의 두 명의 놀라운 투자자: Talia Goldberg와 Ethan Kurzweil. Talia는 샌프란시스코에 기반을 두고 소비자 인터넷 및 소프트웨어 비즈니스에 투자하고 ServiceTitan 및 Discord와 같은 회사와 협력합니다. Ethan Kurzweil 역시 샌프란시스코에 기반을 두고 있으며 개발자 플랫폼, 새로운 데이터 인프라, 디지털 소비자 애플리케이션 및 암호화폐를 포함한 다양한 분야에서 투자자를 이끌고 있습니다.

그런 다음 Intercom의 기계 학습 책임자인 Fergal Reid와 함께 Intercom이 몇 가지 AI 보조 기능을 포함하여 최신 제품에 이 기술을 통합하는 방법에 대한 내부 정보를 제공합니다. 나는 그들의 머리를 고르고 그들이 스타트업과 벤처 전선 모두에서 보고 있는 것과 GPT가 가져올 변화를 들을 수 있기를 기대합니다. 프로세스 전반에 걸쳐 질문이 있는 경우 채팅에 자유롭게 질문을 표시하면 대화가 끝날 때 약 15~20분 동안 질문을 검토할 수 있습니다.

Fergal, 당신부터 시작하겠습니다. 왜냐하면 당신은 방의 기술자이고 GPT를 Intercom 제품에 통합하는 일선에 있기 때문입니다. 약간의 배경 지식을 제공하고 GPT와 ChatGPT가 무엇이며 이 기술을 통합하게 된 계기를 설명하는 것으로 시작할 수 있습니다.

"나는 규칙을 코딩하지 않을 것이며 'X 대 Y를 예측하는 방법을 배우십시오'라고 구체적으로 말하지 않을 것입니다."

Fergal Reid: 지금은 기술 분야에서 매우 흥미로운 시기입니다. ChatGPT가 큰 파장을 일으켰기 때문에 많은 사람들이 이 시점에서 ChatGPT를 본 적이 있을 것입니다. 하지만 기술적인 관점에서, 세상을 보는 좁은 관점에서 저는 Intercom에서 약 5년 동안 일했고 기계 학습 팀을 운영하고 있습니다. 그리고 우리가 수행한 기계 학습 작업은 지도 학습 알고리즘, 사물을 구분하는 방법을 배우는 알고리즘을 사용하여 한동안 사용된 알고리즘을 사용하고 있습니다. 당신은 "이봐, 누군가가 이것 또는 저것을 요구할 것인지 예측해보자." 이러한 기계 학습 시스템을 사용하면 많은 교육 데이터를 제공합니다.

그리고 이 생성적 AI의 최신 물결에서 새롭고 다른 점은 모델이 이런저런 것을 예측하도록 가르치는 대신 “이봐, 모델. 이 유형의 새 데이터를 생성하는 방법을 알아보세요. 이미지를 생성하는 방법을 배우십시오.” 텍스트를 입력하면 해당 텍스트에 매핑되는 이미지를 생성하는 방법을 배우거나 ChatGPT를 사용하여 말을 걸고 텍스트를 입력하면 그에 대한 응답으로 더 많은 텍스트를 생성하는 데 꽤 능숙해집니다.

"우리는 정말 큰 모델을 가지고 있습니다. 우리는 영어로 질문하고 영어로 작업을 지시합니다. 그리고 그것은 우리가 말하는 것을 꽤 잘합니다."

기계 학습을 수행하는 다른 방식일 뿐입니다. 저는 규칙을 코딩하지 않을 것이며 구체적으로 "X 대 Y를 예측하는 방법을 배우십시오"라고 말하지 않을 것입니다. 대신에 저는 정말 많은 양의 교육 데이터를 가져와서 해당 교육 데이터를 예측하는 데 매우 능숙한 모델을 만들 것입니다. 그런 다음 새로운 예제를 생성하여 유용한 작업을 수행할 수 있기를 바랍니다.

ChatGPT를 사용하면 텍스트를 제공하고 "다음에 생성할 항목 생성"이라고 말하여 무언가를 요청합니다. 놀랍게도 꽤 유용합니다. "여기 고객 지원 대화가 있습니다. 이것은 지원 대화의 요약입니다."라고 말한 다음 ChatGPT에 제공하면 다음에 일어날 일 또는 다음에 볼 것으로 예상되는 일이 생성됩니다. 그리고 아마도 "요약입니다."라고 말하면 요약이 나타납니다. 그리고 그것은 매우 유용합니다. 기능과 시스템을 구축하는 매우 일반적인 방법입니다. 모든 작은 일에 대해 새로운 머신 러닝 시스템을 코딩하는 대신, 우리는 정말 큰 모델을 가지고 있고 영어로 질문하고 영어로 일을 하라고 지시합니다. 그래서 Intercom에서는 이를 사용하여 제품 기능을 구축하려고 노력해 왔습니다.

고객 서비스를 위한 게임 체인저

Krystal Hu: 나는 Talia와 Ethan을 공간의 다작 투자자로 무대에 올리고 싶습니다. 당신은 몇 가지 기술적인 물결을 보았습니다. 제너레이티브 AI에 대한 이번 연구는 어떻게 다른가요? 그리고 당신이 기대하는 응용 분야는 무엇인가요?

Talia Goldberg: 물론입니다. 초대해 주셔서 감사합니다. 제너레이티브 AI가 무엇인지에 대한 훌륭한 개요였습니다. 웃기게도, 이 회의 직전에 지난 여름, 아마도 8~9개월 전에 우리 블로그에 게시한 글을 보고 있었는데, 이것은 ChatGPT가 출시되기 몇 달 전이었지만, 우리는 많은 모멘텀을 보기 시작했습니다. 그리고 특히 대규모 언어 모델에서 일어나고 있는 일과 인공 지능의 새롭고 강력한 물결로서의 AI 및 생성 AI의 잠재력에 대해 흥분할 이유가 있습니다.

"현재 온라인 콘텐츠의 1% 미만이 AI를 사용하여 생성되며 향후 10년 이내에 최소 50%가 AI에 의해 생성되거나 증강될 것으로 예상합니다." 그리고 우리는 그것에 대해 토론하고 있었고 말도 안되는 말이라고 생각했지만 젠장, 우리는 AI가 우리가 보는 많은 정보를 얼마나 빨리 변형시킬 수 있는지 과소 평가했습니다. 온라인 상호 작용, 콘텐츠 및 미디어의 향후 2년 이내에 50%가 될 수 있다고 말하고 싶습니다. 그 의미는 고객 지원을 포함하여 많은 정보 및 지식 작업에 걸쳐 방대하다고 생각합니다.

"파괴, 개선, 증강 및 개선을 위한 기술이 무르익은 끈끈한 사용 사례를 바로 볼 수 있으며 고객 지원이 곧 바로 진행됩니다."

Krystal Hu: Ethan, 인터컴과 꽤 오랫동안 작업을 하셨는데요. 지금이 고객 서비스팀이 기다려온 순간이라고 생각하십니까? Intercom과 같은 고객 서비스 애플리케이션에는 기술과 기회가 황금이라고 생각하기 때문입니다.

Ethan Kurzweil: 네, 저는 이것이 대규모 언어 모델과 그들이 할 수 있는 것의 최첨단 응용 프로그램이라고 생각합니다. 한 걸음 물러서서 스마트폰 시대, iPhone 시대 등과 같은 기술 변화와 플랫폼 변화에 대해 생각해 보면 초기에 일어나는 일은 이 모든 흥분과 많은 개발자와 제작자가 공간으로 몰려드는 것입니다. 당신은 그것이 먼저 고착되는 최첨단 응용 프로그램과 약간의 환멸의 여물통에 빠지지 않는 응용 프로그램을 볼 수있는이 유실을 가지고 있습니다. 우리는 아직 그 곡선에 조금 이르다고 생각하지만 기술이 중단, 개선, 증강 및 개선을 위해 무르익은 끈끈한 사용 사례를 바로 볼 수 있으며 고객 지원은 바로 그 과정에 있습니다.

저는 거의 8년 반 동안 Intercom과 함께 일해 왔으며 Intercom은 준비가 되었을 때 항상 신기술 채택의 최전선에 있는 팀이었습니다. 그리고 2~3년 전에 사람들이 "자동화, 자동화, 자동화"라고 말했던 것을 기억합니다. 그리고 Intercom의 제품 리더십은 항상 이렇게 말했습니다. “아직 충분하지 않습니다. 우리는 그것을 할 수 있고, 일부 기능 요청 양식의 상자를 선택할 수 있는 방식으로 그것을 고수할 수 있지만, 그것은 정말 좋은 인간과 같은 흐름으로 이어지지 않을 것입니다.” Intercom은 항상 인터넷 비즈니스를 개인화한다는 아이디어를 중심으로 설립되었습니다. 개인적으로 들리지 않는 봇이 있다면 그것은 그것과 직교합니다.

Intercom이 흐름에서 이를 매우 성공적으로 사용하고 있다는 사실은 기술이 준비되었으며 이것이 우리가 영향을 받게 될 많은 것 중 하나라는 것을 보여줍니다. 한 번에 모든 것을 한꺼번에 할 수는 없지만 시간이 지남에 따라 인간과 같은 방식으로 대화할 수 있는 능력을 기계에 제공함으로써 훨씬 더 큰 영향을 보게 될 것입니다.

"곡선과 개선 속도를 보면 지금부터 몇 달, 지금부터 몇 분기, 그리고 지금부터 몇 년 후에는 훨씬 더 좋아질 것입니다."

Talia Goldberg: 한 가지를 추가할 수 있다면 고객 지원은 AI가 영향력을 발휘할 수 있는 완벽한 초기 영역이라고 생각합니다. 그 이유 중 하나는 자연어를 사용하기 때문입니다. 영어로 AI와 대화할 수 있으며 영어로 응답합니다. 코딩할 필요가 없습니다. 정보를 생성합니다. 이것이 바로 고객 서비스 및 지원입니다. 개인화할 수 있고, 불만을 해결하고, 시간이 지남에 따라 점점 더 좋아지는 훌륭하고 사람과 같은 경험을 생성하는 것입니다. 따라서 고객 지원에서 사용하여 이 훌륭한 피드백 루프를 얻을 수도 있습니다.

Ethan이 말했듯이 오늘날 몇 가지 도전과 어려운 일이 있을 수 있지만 기술과 잠재력은 이미 정말 훌륭합니다. 개선 곡선과 속도를 보면 지금부터 몇 달, 지금부터 몇 분기, 그리고 지금부터 몇 년 후에는 훨씬 나아질 것입니다. 이는 우리가 가장 기대하는 범주 중 하나이며 모든 기업이 이를 활용할 수 있고 이에 대해 생각해야 한다고 생각합니다.

Krystal Hu: Fergal, Intercom의 최근 기능 출시와 ChatGPT를 어떻게 통합했는지에 대한 개요를 제공할 적절한 시기입니다.

퍼갈 리드: ​​물론입니다. 그리고 여기서 Talia와 Ethan의 감정을 되풀이하기 위해 도메인에는 너무 많은 구조가 있습니다. 고객 지원 상담원이 마지막 날에 한 것과 동일한 작업을 다시 수행하는 곳에서 수행하는 작업이 너무 많습니다. 의 팀원이 이전에 해본 적이 있고 규칙성과 구조가 너무 많아서 AI를 배우고 사용하여 사람들을 더 빠르게 만드는 시스템이 정말 잘 익은 것처럼 느껴집니다.

“우리는 시작하기 가장 좋은 곳이 사람과 함께 하는 것이라고 생각했습니다. 누군가 받은 편지함에 싸여 있고 우리는 그들을 더 빨리 만들고 싶지만 여전히 그것을 확인하고 승인할 수 있습니다.”

ChatGPT가 출시되었을 때 동시에 OpenAI는 개발자가 사용할 수 있는 이 새로운 모델인 text-davinci-003을 출시했습니다. 우리는 오랫동안 OpenAI와 관계를 유지해 왔으며, 그 모델을 보았을 때 실제로 유용성의 한계점을 넘어섰고 그것으로 구축할 수 있다고 느꼈습니다. 그래서 우리는 몇 가지 초기 벤치마킹을 수행했습니다. 사람들은 받은 편지함에서 많은 시간을 보내며, 그들이 해야 할 일 중 하나는 전달하기 전에 방금 본 대화의 요약을 작성하는 것입니다. 이 기술은 대화 요약을 수행하는 데 정말 뛰어난 것 같았고 "이 작업을 수행하는 기능을 구축하여 베타 고객에게 제공할 수 있습니까?" Intercom에는 "배움으로 배움"이라는 원칙이 있습니다. 우리는 새로운 기능을 고객에게 매우 빠르게 배송할 수 있다고 믿으며, 따라서 문제가 해결되었는지 아니면 호기심에 가까운 것인지 알 수 있습니다.

그래서 기본적으로 12월 초에 실제 받은 편지함에서 고객 지원 담당자와 함께 작동하여 속도를 높일 수 있는 일부 기능을 신속하게 제공할 수 있는지 알아보기 위한 프로젝트를 시작했습니다. 하나는 텍스트를 더 빠르게 작성하는 데 도움이 되는 다른 기능과 함께 요약이었습니다. 생성 AI에는 단점이 있기 때문에 우리는 이 기술을 시작하기에 적절한 장소라고 느꼈습니다. 생각보다 항상 정확한 것은 아닙니다. ChatGPT를 보고, 질문하고, 답변을 받고, "굉장하다"고 생각하기 쉽습니다. 그런 다음 조금 더 자세하게 읽으면 실제로 때로는 문제가 발생합니다. 우리는 시작하기 가장 좋은 곳이 사람과 함께 하는 것이라고 느꼈습니다. 누군가가 받은 편지함에 싸여 있고 우리는 그들을 더 빨리 만들고 싶지만 여전히 그것을 확인하고 승인할 수 있습니다. 훌륭한 출발점이었습니다.

이제 사람들이 댓글에서 "이봐, 스스로 질문에 답할 수 있는 봇이나 물건은 어때?"라고 묻는 것을 봅니다. 우리는 그것이 오고 있고 곧 올 수도 있다고 생각하지만 여전히 그것을 탐구하고 있습니다. 우리에게 가장 큰 문제는 정확성입니다. 우리는 지원 담당자를 더 빠르게 만드는 루프에 인간을 두는 것이 지금 무르익었다고 생각합니다. 그리고 아마도 곧 다음 단계로 내려가는 것들이 있을 것입니다. 그것은 매우 흥미로운 영역입니다.

Ethan Kurzweil: 다시 말해, "이로 인해 카피라이터로서의 내 하루가 소중해질까요?"와 같은 흥미로운 미래지향적 질문을 받고 있습니다. 나는 전혀 그렇게 생각하지 않는다. 이 기술이 있는 곳은 인간의 능력과 지능을 강화하여 카피라이터로서 생산성을 높이지만 반드시 당신을 대체할 필요는 없습니다. 놀라운 고객 지원 또는 비즈니스와의 커뮤니케이션에 대한 기준은 이러한 리소스가 있는 만큼 점점 더 높아질 것입니다. 기술이 자체적으로 일부 카피라이터를 처리하고 응답 사용 사례를 지원할 수 있지만 정말 좋은 카피와 정말 좋은 지원 등에 대한 기준은 우리가 이러한 기술에 액세스할 수 있게 됨에 따라 높아질 것입니다. . 이상적인 상태는 생산성을 높이기 위해 이러한 기술에 액세스할 수 있지만 곧 귀하를 대체하지는 않을 것입니다.

탈리아 골드버그: 네. 나는 Wyatt가 그것이 능력 승수라고 말한 것을 좋아합니다. 우리는 Copilot의 예에 대해 내부적으로 많이 이야기합니다. Copilot은 코딩을 위한 자동 완성과 같으며 이미 엔지니어를 훨씬 더 효율적으로 만들고 있습니다. 그것은 엔지니어나 엔지니어링을 전혀 대체하지 않지만 그것을 보강할 수 있습니다. 가장 기본적인 예는 계산기일 수 있습니다. 옛날에 우리는 손으로 수학을 하곤 했습니다. 이제 우리는 계산기를 사용하지만 수학은 여전히 ​​매우 중요합니다. 우리 모두는 그것을 배워야 하며 수학자들은 이 세상에서 매우 중요합니다. 틀림없이 귀하의 역할은 더욱 중요해질 수 있습니다. 왜냐하면 콘텐츠 제작 비용이 감소하고 다양한 콘텐츠와 정보가 넘쳐나면서 눈에 띄고 우월할 수 있는 콘텐츠와 정보를 만드는 것이 훨씬 더 커질 것이기 때문입니다. 향후 몇 년 동안 프리미엄.

Intercom의 GPT 실험

Krystal Hu: Intercom이 AI 지원 기능을 출시한 지 몇 주가 지났습니다. 당신이 본 초기 피드백은 무엇입니까? 이 기술 통합의 성공을 어떻게 측정합니까?

"우리는 많은 채택, 많은 흥분, 많은 사용을 보고 있습니다."

Fergal Reid: 나는 그것에 대해 매우 투명하게 말할 것입니다. 나는 아직 그 질문에 대해 완전히 만족스러운 대답을 가지고 있지 않습니다. 제가 말씀드릴 수 있는 것은 우리가 지금 가동 중이며 정기적으로 사용하는 수천 명의 고객이 있다는 것입니다. 우리는 많은 채택을 받았습니다. 이것이 실제로 사람들의 생산성을 높이는지 측정할 것입니다. 예를 들어 자체 CS 팀의 경우 "이 기능을 사용하면 더 빠릅니까?"에 대한 원격 분석을 수집할 수 있기 때문입니다. 이를 위해 어떤 형태의 통제된 실험을 조합합니다. 우리는 항상 어떤 시점에서 이것에 대한 어떤 형태의 실제 데이터를 얻고 싶어하지만 아직 그 시점에 도달하지 못했습니다. 적어도 내부적으로는 한두 달 안에 그것에 대한 이해에 대한 몇 가지 수치를 갖게 될 것입니다.

지금 제가 말씀드릴 수 있는 것은 많은 채택, 많은 흥분, 많은 사용을 보고 있다는 것입니다. 고객이 상당한 시간을 절약한다고 말하는 요약과 같은 몇 가지 기능이 분명히 있습니다. "이봐, 일부 대화의 경우 인계에 대한 요약을 작성하는 데 최종 사용자의 문제를 해결하는 데 걸리는 시간만큼 오래 걸릴 수 있습니다." 그래서 우리는 그것에 대해 확실히 기분이 좋습니다.

일부 다른 기능에서는 GitHub Copilot과 같은 속기를 작성합니다. 우리는 Copilot에서 영감을 얻었고 Copilot에서 프로그래머라면 주석이나 속기를 작성할 수 있습니다. 그러면 Copilot이 코드를 채울 것입니다. 우리의 기능 중 하나는 "확장"으로, 속기를 작성하면 더 긴 지원 메시지로 바뀝니다. 때로는 이것이 효과가 있고 사람들의 시간을 절약해 주지만 아직 데이터가 없습니다. 현재 라이브로 제공되는 것은 1세대 버전일 뿐입니다. 그리고 2세대 버전의 프로토타입이 있습니다. 지금은 속기를 작성하고 큰 언어 모델이 이를 확장합니다. 그 대신에 우리가 하려는 것은 “이봐, 당신이 그런 질문에 마지막으로 대답한 시간에 끼어들자. 이와 관련된 매크로를 가져오겠습니다.” 그리고 꽤 잘 작동하는 몇 가지 내부 프로토타입이 있습니다. 우리는 여전히 바늘을 실제로 움직이게 할 일을 혁신하고 수행하고 있지만 아직 지표가 없습니다. 곧.

“Tableau에 OpenAI를 사용한 일일 지출 차트가 있어 늘 주의를 기울이고 있습니다.”

크리스탈 후: 그에 따른 비용은 어떻게 측정하나요? 제가 알기로는 아마도 OpenAI에 문의를 보내면 1,000자당 2센트 정도의 요금이 청구될 것입니다. 그리고 귀하의 채택이 증가함에 따라 그 청구서도 쌓이는 것 같습니다. 이 기술을 통합하는 것에 대해 공유할 배움이나 관찰이 있습니까?

Fergal Reid: 저는 OpenAI로 매일 지출하는 Tableau의 차트를 가지고 있어 우리가 긴장을 늦추지 않고 지켜보고 있습니다. 확실히 고려 사항입니다. 요약 기능에 대해 언급했는데 질문을 전달하기 전에 요약을 요청해야 하는 매우 인간적인 방식으로 기능을 구축했습니다. 고객이 우리에게 하는 말 중 하나는 “이봐, 내가 왜 이 요약본을 요청해야 합니까? 제가 요청하지 않도록 항상 사이드바에 요약을 유지하십시오.” 누군가가 대화에서 새로운 것을 말하고 요약이 변경될 때마다 2센트를 지불해야 한다면 비용이 엄청나게 많이 들기 때문에 비용이 많이 들 것입니다. 우리는 더 전통적인 기계 학습 모델을 사용하지 않는 방식으로 비용을 반드시 고려해야 합니다.

즉, OpenAI는 방금 ChatGPT API를 발표했는데, 그 시리즈의 이전 유사 모델보다 10배 저렴했기 때문에 많은 사람들이 놀랐다고 생각합니다. 비용이 매우 빠르게 떨어지고 이러한 기능이 널리 채택될 가능성이 있습니다. 이 분야에서 다른 신생 기업이나 회사는 어떻습니까? Intercom에서 우리가 제공할 조언은 시장에 빠르게 진출하라는 것입니다. 여기에는 귀하가 구축하고 잠금 해제할 수 있는 고객을 위한 진정한 가치가 있기 때문입니다. OpenAI와 같은 공급업체가 모델을 더 효율적으로 만드는 방법을 알아내거나 모델을 사용하는 더 효율적인 방법을 알아내므로 모델이 더 저렴해지기 때문에 비용이 낮아질 것입니다. "이봐, 대화의 첫 번째 부분에 더 저렴한 생성 모델을 사용할 수 있습니다. 그리고 더 많은 정확도가 필요한 훨씬 더 어려운 작업이 있을 때 더 비싼 모델을 사용하겠습니다. .” Ethan과 Talia는 저보다 훨씬 더 넓은 시각을 갖고 있을 것입니다. 저는 그들의 생각을 듣고 싶습니다.

"개발자가 새로운 기술을 가지고 API를 호출할 때마다 2센트를 지불하지 않는 곳에서 새로운 기술을 사용하여 무엇을 할지 확신할 수 없습니다."

Ethan Kurzweil: 음, 이러한 최첨단 기술에서 가끔 볼 수 있는 좋은 예입니다. 처음에는 가치가 높은 사용 사례가 이를 얻고 해당 원칙의 실현을 설명하고 있습니다. Intercom에서 오늘 요청한 요약 기능입니다. 그러나 시간이 지남에 따라 이 기술은 훨씬 더 보편화되고 저렴해질 것입니다. 그리고 그때가 바로 한계 비용이 오늘날 엄두도 못 낼 정도로 많은 사용 사례로 확산될 수 있고 개발자가 우리가 실제로 예측하지 못하는 이러한 유형의 AI에서 대규모 언어 모델의 다른 응용 프로그램을 발견할 수 있게 하는 때입니다.

Bessemer에서 Talia와 저는 기술이 나아갈 방향에 대한 로드맵을 제시하려고 노력하지만 개발자 지향적인 투자자로서 제가 항상 생각하는 핵심 기본 사항 중 하나는 개발자가 무엇을 할 것인지 확신할 수 없다는 것입니다. 새로운 기술, 새로운 플랫폼, API를 호출할 때마다 2센트를 지불하지 않고 사용할 수 있을 때까지 무언가에 대한 새로운 액세스가 가능하고 처음에는 터무니없게 들리는 일을 반복하고 수행할 수 있습니다.

수많은 실험이 있는 지점에 도달한 기술에 흥분됩니다. Intercom의 제품 로드맵에는 오늘이 아니라 1년 후 우리가 예측하지 못했지만 고객에게 정말 높은 가치를 제공하는 것들이 있을 것이라고 확신합니다. 그리고 생성 텍스트를 사용할 수 있는 특정 방법을 소개하고 누군가를 위한 정말 훌륭한 사용자 경험을 만들었기 때문에 막 나온 신생 기업도 있을 것입니다.

Talia Goldberg: 지원과 관련된 경험을 강화할 수 있는 인간과 같은 잠재력을 강조할 수 있는 재미있는 예가 있습니다. 예를 들어 내가 강한 아일랜드 억양을 가진 Intercom 팀과 이야기하고 있는데 그들은 아마도 내가 미친 서양식 억양을 가지고 있다고 생각할 것입니다. 말이 정말 빨라요. 모두가 영어로 말하는데도 다른 언어처럼 들립니다. AI는 실시간으로 사람의 악센트를 약간 변경하여 두 가지 방식으로 더 이해하기 쉽게 만들 수 있습니다. 그래서 제가 아일랜드 억양이나 영국 억양을 가지고 있다면 그것을 캘리포니아 억양으로 번역할 것이고 그것은 의사소통의 장벽을 낮추어 어떤 면에서 경험을 정말로 향상시킬 수 있습니다.

Ethan Kurzweil: 좋은 예입니다. 기술이 직접적인 의사소통의 중심에 있지만 더 인간과 비슷하게 만들고 있기 때문입니다. 이것은 모순처럼 들리지만 잘 배치되면 메시징이나 의사소통 맥락에서 더 연결되어 있다고 느낄 수 있습니다.

Talia Goldberg: 이것이 인터넷의 약속입니다. 우리 모두를 하나로 모으고 장벽을 허무는 것입니다. 나는 그것을 과급할 수 있는 잠재력을 정말로 믿습니다.

신뢰 지수

Krystal Hu: 많은 분들이 정보의 흐름과 관련하여 모든 것이 정확하고 정확한지 어떻게 확인하는지에 대해 궁금해하시는 것 같아요. 사용 사례에 따라 지분은 다르지만 일반적으로 고객에게 잘못된 정보를 제공하고 싶지는 않습니다. 그것을 어떻게 보장합니까?

“인간으로서 불가능하기 때문에 그런 것들을 결코 볼 수 없다는 것이 아니라 적절하게 필터링할 수 있다는 것입니다. 그것이 제가 대규모 언어 모델에 대해 생각하는 방식입니다.”

Talia Goldberg: 댓글 한 개만 드리고 Fergal이 Intercom에 대해 좀 더 구체적으로 답변하도록 하겠습니다. 모델은 엄청난 양의 데이터(수십억 포인트의 데이터 및 정보)에 대해 학습됩니다. 따라서 아무리 데이터를 속이거나 잘못된 데이터를 입력하더라도 여전히 전체 데이터의 아주 작은 부분입니다. 이러한 모델이 생성되는 방식에 대해 생각할 때 염두에 두어야 할 한 가지 사항입니다.

다른 하나는 데이터 입력입니다. 잘못된 데이터에 대해 교육을 받았는지에 대한 우려가 있다는 것을 알고 있습니다. 오해하지 마세요. 환각 및 기타 영역에 확실히 문제가 있으므로 개선해야 할 것이 많습니다. 그러나 당신의 삶에서 그것은 당신이 돌아다니며 잘못되거나 편향되거나 심지어 잘못된 정보일 수 있는 것들을 보지 않는 것이 아닙니다. 당신은 그것을 발견하지만 당신의 판단과 마음을 사용하고 다른 많은 좋은 데이터가 있습니다. 그래서 인간으로서 불가능하기 때문에 그런 것들을 결코 볼 수 없다는 것이 아니라 적절하게 걸러낼 수 있다는 것입니다. 이것이 제가 대규모 언어 모델에 대해 생각하는 방식입니다. 학습 세트에서 원하는 데이터와 정보가 아닌 경우가 있을 수 있지만 이를 필터링하고 올바른 답을 얻는 언어 모델의 기능은 시간이 지남에 따라 점점 더 좋아질 것입니다.

“그것은 매개 변수 중 하나일 수 있습니다. '이 응답에 대해 얼마나 확신이 있습니까?' 충분하지 않으면 주지 마십시오.”

Ethan Kurzweil: 데이터 프라이버시와 정확성에 관한 몇 가지 흥미로운 질문이 있습니다. 프라이버시 부분에 도달하기 전에 데이터 정확도 질문에 대해 염두에 두어야 할 또 다른 사항은 미래에 일부 대규모 언어 모델에서 실제로 정확도 지수를 설정할 수 있다는 것입니다. AI가 Jeopardy에서 이기도록 프로그래밍된 경우와 비슷합니다. 질문에 대한 답을 90% 신뢰도 또는 60% 신뢰도로 알고 있다는 신뢰 구간이 있었습니다. 그리고 오답으로 약간의 점수를 잃는 맥락에서 그들은 간격을 40% 정도로 매우 낮게 설정했습니다. 40% 이상 확신한다면, 가서 질문에 답해 보세요.

인간 수준의 정확도를 원하는 맥락이 있을 수 있고, 거기에 설정하고, AI가 99 백분위수에 도달할 수 없을 때 많은 경우 인간에게 넘어갑니다. 교육받은 AI 지원 추측에 대해 더 많은 관용을 갖는 고도로 규제된 산업에서조차 군대에서도 어느 정도 맥락이 있을 수 있습니다. 그리고 그것은 매개 변수 중 하나가 될 수 있습니다. "이 응답에 얼마나 확신이 있습니까?" 충분하지 않으면 주지 마십시오.

Fergal Reid: Ethan, 우리가 내부적으로 Intercom에 가지고 있는 제품에 대한 강한 믿음입니다. 다양한 허용 오차가 있을 가능성이 매우 높다는 것입니다. “제안 좀 해주세요. 때때로 제안이 틀려도 괜찮습니다.” 그리고 매우 낮은 허용 오차를 가진 다른 고객이 있을 것입니다. 이에 대해 어느 정도의 구성이 필요할 것으로 예상합니다.

“우리는 훨씬 더 나은 예측을 하고 작업을 훨씬 더 빠르게 수행할 수 있는 이 새로운 기술을 가지고 있습니다. 우리는 그것을 어떻게 받아들이고 그것을 충분히 신뢰할 수 있게 만들거나 적어도 고객이 선택할 수 있도록 허용합니까?”

우리가 앞으로 살펴보고 있는 몇 가지 잡초에 대해 알아보기 위해 기사를 소비하고 해당 콘텐츠에 대한 질문에 답하려는 무언가가 있다고 가정해 보겠습니다. 한 가지 예는 "당신은 이것의 정확한 인용으로만 응답할 수 있습니다."라고 말하도록 제한하는 것입니다. 그리고 그 인용문을 문맥에 넣을 수 있지만 인용문은 거기에 있어야 합니다. 이는 이러한 새로운 대형 언어 모델을 사용하여 쿼리를 이해하고 정보를 검색하는 데 더 나은 작업을 수행하지만 실제로 말할 수 있는 내용을 제한하는 보수적인 방법입니다. 또 다른 예는 생성 모델을 사용하여 후드 아래에서 생성되도록 허용하지만 미리 정의된 일련의 작업 또는 말할 수 있는 내용을 통해서만 최종 사용자와 상호 작용할 수 있습니다.

강력한 엔진을 사용하여 더 안전하고 신뢰할 수 있으며 제한적인 엔진으로 만들기 위한 많은 기술이 있습니다. 그리고 저는 여러분이 그 기술을 가지고 일하는 많은 사람들을 보게 될 것이라고 생각합니다. 우리는 훨씬 더 나은 예측을 하고 훨씬 더 빠르게 일을 할 수 있는 이 새로운 기술을 가지고 있습니다. 우리는 그것을 어떻게 받아들이고 그것을 충분히 신뢰할 수 있게 만들거나 적어도 고객이 선택할 수 있도록 허용합니까? 앞으로 몇 달 동안 이 공간에서 많은 움직임을 보게 될 것이라고 생각합니다.

산업 전반에 걸친 대량 개인화

Krystal Hu: 그런 의미에서 Ethan, Talia, 고객 서비스 외에 이 공간에서 특별히 기대하는 다른 애플리케이션이 있습니까?

Ethan Kurzweil: 먼저 갈 수 있습니다. 일부 소비자 애플리케이션을 살펴보면 게임은 우리가 기대하는 것 중 하나입니다. 게임을 재미있게 만드는 요소가 무엇인지 생각해보면 새로운 콘텐츠에 대한 새로 고침 빈도가 많으며 이를 위해서는 끊임없이 창의적인 아이디어가 떠오를 필요가 있습니다. "모든 플레이어의 모든 경험이 새롭다면 어떨까?"라고 생각하는 사람들을 보기 시작했습니다. You couldn't have a personal copywriter writing that much content for each person, but an AI could do it. And it could get down to a level where each decision you make generates a new experience based on whatever temporal inputs you want to give the system.

“We went from handcrafted goods to mass-produced goods to mass personalization in a way we've probably never seen before”

Media applications as well. Earlier in my career, I used to work at the Wall Street Journal , and the parent company of the Wall Street Journal was Dow Jones. They had a sister news department called Dow Jones Newswires , which was about getting financial news mainly to traders and folks that needed to act very quickly on that information as fast as possible through terminals and things like that. I think about what an AI could do to augment news or get news to the end user more quickly. Again, I don't think it's replacing journalists at all, I think it's augmenting the amount of information and the targeting we can provide to folks much more quickly.

I think about entertainment use cases. This promise of personalized television and premium content services has always been out there, but when you get to the long tail of internet content and user-generated content, it tends to be pretty low-quality. Could you have a high-quality, personalized content delivery service? I think AI could impact that equation in the future.

Talia Goldberg: I love the concept of personalization and everyone having their own experience. We went from handcrafted goods to mass-produced goods to mass personalization in a way we've probably never seen before. This is a totally new experience for everyone, which is super cool. I'll share one of the areas that I think is going to be wildly impactful and really promising, which is in life sciences and biotech.

“The AI is seeing something that we, as humans, have never before been able to see”

Applying AI to drug discovery and development using huge amounts of data to look at molecules and protein structures and genomic data can be really transformative. I read this study that I think was in Nature a month ago, and it described how some researchers gave an AI a bunch of images of a human retina, and the AI, with 90% accuracy, said which retina belonged to either a male or a female. That seems very basic – who cares? But what's really crazy about that is that no researcher, scientist, or AI expert has ever been able to find any sign of a retina correlating to gender of any form. The AI is seeing something that we, as humans, have never before been able to see.

You think about that, and then you apply that to cancer and different cells and otherwise, and the potential is just massive and really exciting. And we're already seeing a lot of applications. AI's going to transform a whole bunch of things – health, software, business applications, logistics, consumer… We could make a long list, but there are a ton of reasons to be super optimistic.

믹스 앤 매치

Krystal Hu: When I talk to startups, when they're incorporating this kind of technology into their offerings, one choice they have to make is which model they work with. Do they only work with one type of model, or do they diversify their vendors to work with other companies besides OpenAI? I'm sure, Fergal, you've spent some time thinking about that. What was the experience like at Intercom?

Fergal Reid: With new technology, being right in the forefront, our head tends to go first to customer value. We're happy to use the most expensive or newest model to try and figure out, “Okay, can we really build a transformative experience for a customer with this that is a core part of the workflow and makes something valuable for them?” And once we do that, we're like, “Okay, now, how can we make it cost-effective?” And we're probably going to end up with a large mix of different models from, say, OpenAI, and we've also looked at other vendors like Anthropic, which are doing some really interesting work in this space too.

“It's highly likely that everyone's going to end up running a bespoke mix of many different models. It's going to get complex pretty fast”

It's an exploding space with many different people training large language models, and I think you'll have different large language models that are better and worse and have different trade-offs in terms of cost and latency and performance. Performance won't be one-size-fits-all. Some models are better at dealing with hallucinations, some are better at generating creative content, and I think we're already seeing that.

Our focus is to get whatever models we can, try them out, think if we can use these to build transformative value, get it live with our customers, and then figure out how to optimize that. Once we know it's delivering value, let's optimize it in terms of price and cost and work. It's highly likely that everyone's going to end up running a bespoke mix of many different models. You could have three different models in one customer interaction. So yeah, it's going to get complex pretty fast.

“There'll probably be a new set of metrics that everyone coalesces around that measure the effectiveness of your AI and your particular business problem”

Ethan Kurzweil: I think that's an interesting point that actually ties the question from before: how do you measure the success of this? Because I think lots of companies will try a model or many, and the question will be, “All right, which is best?” And that's such an oversimplification because you have to figure out what you are trying to achieve. Are you trying to achieve engagement with users? Are you trying to achieve a quick resolution?

I think there'll probably be a sort of metricization of this where people come to a standard, like the way Google Search created a new industry, AdWords, and the way we measure click-through rates and conversion rates and things like that. There'll probably be a new set of metrics that everyone coalesces around that measure the effectiveness of your AI and your particular business problem.

Fergal Reid: Yeah, even before these more recent language models, we've had bots that process natural language using pretty big neural networks, although not as big. And whenever we would do something like upgrade our bots, we would conduct a large-scale A/B test framed in terms of end-user metrics such as self-serve rate. Then, we would find edge cases for particular customers or domains where it performed less well, really dig into those, and make sure nothing was broken. I think there's probably a well-understood playbook, like Ethan's referring to, of metrics for given domains. A lot of the same things will apply to this new type of technology.

Q&A

Krystal Hu: I'd love to get to the Q&A. I think we were able to address some of the questions during our discussions, but there are a bunch about the potential roadmaps from, I assume, Intercom's customers or companies working with Intercom who want to know what could be the next AI-aided feature that may come out, both in the short-term and long-term, and also how that will affect the pricing strategy.

Fergal Reid: Cool. Do you want to call out one particular question?

Krystal Hu: I think there was a question about your roadmap for the features for the next six months versus 12 to 18 months, and then the other person asked about the pricing strategy.

Fergal Reid: We have some things coming up that unfortunately, I can't talk about at the moment. I would say that six months is a really long time in this space. I expect you'll see a lot of movement in this space over the next two or three months. We will continue to sweat and invest in these features in our Inbox to make support reps more efficient. I've already talked about how we've got a Generation 1 version of features here at the moment, with summarization and expansion features to help edit a text, and we're definitely working on Generation 2 versions of those features.

We've also met two other exciting features in this space that we're really excited about, but unfortunately, I can't share any details at the moment – it's just a little bit too early to announce and launch those things. I can promise you're going to see a lot of action and excitement from us, and I'm sure from other companies in this space as well, over the next six months.

“Right now, there's a bit of a context limit for each interaction with an AI in a large language model, but there's a lot of exciting research pushing the boundaries”

Krystal Hu: Talia and Ethan, do you have any expectations or hopes on how fast the space could move?

Talia Goldberg: Well, it's moving a lot faster than we even anticipated. The space is moving really quickly in part because there are a whole bunch of technological advances happening at the same time as the hardware that these models are trained on gets better and improves at a Moore's Law rate, and there are new architectures and ways of scaling on that hardware. We're getting better and better at creating new experiences and models.

I don't have an exact prediction of how quickly we'll see different things, but one of the biggest areas that we're watching closely and expect to see a lot of advances in over the next six to 12 months is around personalization and being able to create far more personalized experiences. Right now, there's a bit of a context limit for each interaction with an AI in a large language model, but there's a lot of exciting research pushing the boundaries of those context windows, coming up with new frameworks to create far more personalized experiences and remember each person, each user, each customer, and tons of data points about that person to create a better experience.

“I would encourage everyone that's building new products to ride the ups and the downs”

Ethan Kurzweil: I completely agree with Fergal and Talia. We're going to see predictable and unpredictable applications of this over the next six months. There'll be some unsuccessful ones too, and then the narrative will quickly shift to, “Oh, that didn't do everything we thought it was going to do as quickly as we thought.” Right now, we're into the peak of momentum and euphoria and, dare I say, a little hype in the space. But over time, it'll become as big a deal as we thought.

I would encourage everyone that's building new products to ride the ups and the downs. Don't ride the up as high as it may be feeling like you should right now, but when the narrative changes a little bit, because it will – all new technologies have that “Oh, that wasn't as impactful as quickly as we thought” moment – I would encourage everyone to keep building through that as well.

Krystal Hu: Yeah, I'll definitely take that from you as a crypto investor.

Ethan Kurzweil: It's the same thing. Right now, there's clearly a trough of disillusionment for crypto. And good builders are figuring out, “Okay, what of this technology is applicable? What makes sense?” And we'll see those things come to market over the next couple of years.

Krystal Hu: One common question I saw in the Q&A is: how will this impact human jobs like human agent jobs? I'm curious to hear your thoughts on this specific case.

Ethan Kurzweil: Ever since the advent of the computer, there's been this prediction that it would be a massive replacement for human work at all levels. It does change the nature of work, and this will certainly change in some ways, but it's not going to be a wholesale replacement for humans in any broad way.

"뭔지 맞춰봐? Every year, we need way more engineers. It's like Jevon's Paradox. The more that AI is available and the cost goes down, the more demand there is”

Just as Talia alluded to the example of Copilot and people, I've read many articles saying this was going to put all developers out of business over the next two to three years, and that's complete BS. Everyone knows that's not true. But it may allow for more productivity and for the cycle time on software to speed up. It may allow for different skills to be more important. I think it just makes us more productive. It's not that it won't have an impact and won't shift the nature of work in some ways. I don't mean to minimize that because that's very real. But looking at the whole, you'll see we come out ahead.

Talia Goldberg: At least until we reach the singularity, I'm pretty convinced of the need for more and more engineers. You could have gone back 10 years and been like, “Ah, there are all these cool developer tools now that are coming out and making it way easier to integrate things,” or, “Oh gosh, there are these self-serve products like Zapier that make it easy for non-technical people to connect products and integrate things.” 그리고 무엇을 추측합니까? Every year, we need way more engineers. There's a shortage. It's like Jevon's Paradox. The more that AI is available and the cost goes down, the more demand there is. And I think, in a lot of areas, that paradigm will hold true. But as Ethan said, the exact skills and the way it looks may shift.

Krystal Hu: Yeah, that makes a lot of sense. I saw some interesting observations and questions about whether you should tell people that they are talking to an AI versus a real person. It's an interesting question because it presumes we wouldn't be able to tell.

Ethan Kurzweil: It's a good existential question. If you're talking to a person assisted by an AI, who are you talking to, and what disclosure do you have to make in that case? I don't have any answers to these questions, but they're great ones for us to debate.

Talia Goldberg: I find that AI can sometimes generate responses that are so detailed and so good that there's just no way that a human did it anyway. It's like the reverse of the Turing test.

크리스탈 후: 안전 기능에 대한 또 다른 질문입니다. 이전에도 이에 대해 언급한 것 같지만 구체적인 질문이 있습니다. “모델 공급자와 안전 기능의 수직적 통합이 얼마나 중요한가요? 예를 들어 OpenAI의 조정 API를 ChatGPT 모델 출력과 함께 사용하는 것과 Jigsaw의 Perspective API를 혼합하여 사용하는 것이 얼마나 중요한가요?” Fergal, 당신은 그것에 대해 공유할 몇 가지 생각이나 경험이 있을 수 있습니다.

Fergal Reid: 예, 저는 Jigsaw의 Perspective API에 익숙하지 않아서 구체적으로 알지 못합니다. OpenAI와 Tropic의 모든 사람들과 대규모 언어 모델을 훈련하는 다른 사람들은 모델을 사용 가능하고 안전하고 정렬하는 데 많은 관심을 가지고 있으며 환각을 피하는 데 많은 관심을 가지고 있습니다. 그리고 그들은 Intercom과 같은 회사가 신뢰할 수 있는 방식으로 더 쉽게 배포할 수 있도록 이러한 영역에서 계속 작업할 것입니다. 나는 우리가 그것을 수직적으로 통합할 필요가 있다고 확신하지 않습니다. Intercom이 우리가 제품화를 해결하고 충분히 신뢰할 수 있게 만들기 위해 자체적인 대규모 대규모 언어 모델을 교육하는 사업에 참여해야 하는지 모르겠습니다. 어쨌든 이 공간에서 많은 움직임을 보게 될 것이라고 생각합니다.

이러한 종류의 생성 AI는 사용자가 모델을 배포하는 방법을 시도하고 알아낼 수 있는 많은 자유를 제공합니다. 새로운 프롬프트 엔지니어링 분야가 있습니다. 저희 팀은 프롬프트를 편집하고 "좋아요. 내가 원하는 것을 올바른 방식으로 모델에게 어떻게 물어봐야 할까요?" 내가 찾고 있는 결과를 제공합니까?” 적어도 잠시 동안은 더 좋아질 것입니다. 더 강력해질 것이고 모델을 제어하기가 더 쉬워질 것입니다.

Intercom의 위치에 있는 기업들이 많은 가치를 창출하고 많은 애플리케이션과 디자인을 파악하는 것을 볼 수 있을 것이라고 생각합니다. 우리는 여전히 이 새로운 기술을 중심으로 제품을 설계하는 방법을 배우고 있습니다. 우리 위치에 있는 사람들이 그것을 사용할 수 있는 자유도가 너무 많습니다.

“항상 이런 긴장이 있습니다. 일반적인 것에 편승합니까? 일반 모델이 미세 조정에 비해 얼마나 더 나아졌습니까?”

크리스탈 후: 인터컴이 자체 모델을 구축하는 것에 대한 질문도 있었다. 앞서 언급했듯이 API 등을 만드는 동안 사용 사례에 더 적합한 모델을 혼합할 수 있는 기회가 있을 수 있습니까?

Fergal Reid: 예, 현재 이러한 모델이 훈련되는 규모로 볼 때 Intercom과 같은 규모의 모든 회사가 자체적으로 훈련하는 것이 경제적으로 타당하지 않은 것 같습니다. 그러나 다시 말하지만 여기에는 스펙트럼이 있습니다. 우리는 그것들을 중심으로 설계하고 모델에 무엇을 요구해야 하는지 아는 전문성을 개발할 것입니다. 그리고 우리는 Intercom 미세 조정 모델과 같은 회사 주변에서 새로운 기능을 보게 될 것입니다. 이러한 많은 새로운 모델은 사람의 피드백을 통한 강화 학습으로 훈련됩니다. 그렇게 하는 비용은 시간이 지남에 따라 낮아질 것이며 특정 사용 사례에 맞게 더 많이 사용자 지정할 수 있을 것입니다.

항상 이런 긴장이 있습니다. 일반적인 것에 편승합니까? 일반 모델이 미세 조정 및 특정 작업을 수행하는 것보다 얼마나 더 나은 결과를 얻습니까? 우리는 이 공간이 어떤 역할을 하는지 지켜봐야 하겠지만, 기업이 이러한 모델을 채택하고 해당 지역에 맞게 맞춤화하고 제품화할 수 있는 자유도가 상당히 높을 것이라고 생각합니다. 우리는 이 기술의 제품화 초기 단계에 있습니다. 많이 바뀔 것이고 우선순위를 정하기가 훨씬 쉬워질 것입니다.

Krystal Hu: 멋진 대화가 거의 끝나가는데 두 가지 질문을 더 드릴 수 있습니다. 하나는 엔터프라이즈 기업이 ChatGPT에서 가치를 채택하고 추출하는 방법에 관한 것입니다. 당신은 기업들이 그것을 제품에 통합하기 시작하는 것을 보았고, 다른 한편으로는 회사, 특히 규제가 엄격한 은행이 정보 서비스 및 개인 정보 보호 문제에 대해 궁금해하고 직원이 회사 노트북에서 노는 것을 금지하고 있다고 생각합니다. 이 질문에 대한 Talia와 Ethan의 생각이 궁금합니다.

Talia Goldberg: 우리 포트폴리오 전반에 걸쳐 실제로 선두에 있는 Intercom과 같은 범주에 속하지 않을 수도 있는 많은 소프트웨어 회사는 이렇게 생각하고 있습니다. 이러한 모델 또는 ChatGPT API 중 일부를 내 제품에 통합할 수 있습니까?” 매우 반복적인 작업은 AI가 자동화 또는 능률화하는 데 정말 유용할 수 있습니다. 우리 회사 중 한 곳은 고객으로부터 많은 회계 정보를 얻었으며 오류나 잘못된 것이 있으면 조정하고 표시해야 합니다. 그리고 그들은 과거에 이러한 규칙 기반 시스템을 가지고 있었지만 AI를 적용하고 훨씬 더 나은 정확도를 가질 수 있습니다. 또 다른 흥미로운 예는 요약 부분과 관련이 있습니다. 고객이 콜센터 상담원이나 영업 담당자와 대화하는 경우 해당 대화를 요약하고 해당 사람만을 위한 맞춤형 마케팅 자료를 만들 수 있습니다.

Krystal Hu: Talia와 Ethan에게 마지막 질문입니다. 사람들은 사전 시드 스타트업 또는 일반적으로 스타트업에 투자할 때 무엇을 찾고 있는지 묻고 있었습니다.

"우리는 '이것이 특정 역할이나 유형의 사람에게 정말 바늘을 움직이는가?'라는 핵심 질문으로 세분화하려고 합니다."

Ethan Kurzweil: 좋은 질문입니다. 그에 대한 답변은 매우 다양합니다. Pre-seed는 면책 조항을 적용하기 위해 일반적으로 투자하는 것보다 약간 더 빠릅니다. 일반적으로 우리는 이후의 seed 또는 시리즈 A 또는 B에 투자합니다. 그러나 우리의 철학은 우리가 찾을 수 있는 곳이면 어디에서나 초성장 모델을 찾는 것입니다. 그들을. 그리고 일반적으로 우리가 그것을 세분화하는 방법은 로드맵을 통해 사전 진단을 시도하는 것입니다. 그리고 Talia는 AI와 그 응용 프로그램에 대한 우리의 많은 생각을 다양한 다른 것들에 밀어붙이는 사람이었습니다. 우리가 생각하는 다양한 주제 영역은 꽤 흥미롭습니다. 클라우드 컴퓨팅이나 의료 서비스의 소비자화처럼 정말 광범위할 수도 있고 AI가 고객 서비스에 미치는 영향처럼 좁을 수도 있습니다.

우리는 활발한 논문을 블로그와 소셜 미디어에 많이 게시하기 때문에 여러분이 만들고 있는 것이 무언가와 일치하는지 확인하기 위해 사람들이 살펴보도록 권하고 싶습니다. 그런 다음 일반적으로 말해서 "이것이 우리가 일하는 방식이나 오락을 바꾸는 일종의 영향을 미치거나 일부 비즈니스 프로세스나 소비자 요구에 있어 패러다임 전환이 될 수 있는 무언가가 있습니까?"를 찾고 있습니다. 그것이 우리가 그것을 분해하는 것입니다. 우리는 광범위한 기반의 행동 변화가 있을 때마다 초고속 기업으로 이어지고 신생 기업이 일이나 여가 또는 이전에 수행했던 모든 것을 방해할 수 있는 기회를 갖게 된다는 것을 알아차렸습니다. 그래서 우리는 "이것이 특정 역할이나 유형의 사람에게 정말 바늘을 움직이는가?"라는 핵심 질문으로 분해하려고 합니다.

Krystal Hu: 이상으로 대화를 마칩니다. Intercom의 새로운 기능을 사용해 볼 기회가 없는 분들을 위해 요약 및 몇 가지 다른 기능을 직접 사용해 보시기 바랍니다. 그리고 벤처 공간에 관심이 있다면 Bessemer의 웹 사이트를 꼭 살펴보십시오. 모두가 말했듯이, 지금부터 6개월 후에 우리는 되돌아보게 될 것이고 일부 예측은 실현될 것이고 일부는 완전히 다를 것입니다. 돌아가서 더 많은 질문을 다룰 수 있는 또 다른 시간이 있기를 바랍니다. Talia, Ethan, Fergal에게 다시 한 번 감사드립니다. 오늘 시간 내주셔서 감사합니다.

Ethan Kurzweil: 초대해주셔서 감사합니다.

탈리아 골드버그: 안녕.

Fergal Reid: 여러분, 정말 감사합니다. 안녕.

인사이드 인터콤 팟캐스트 (가로) (1)