GPT 4.5의 기능과 기대에 대한 논의

GPT 4.5의 기능과 기대에 대한 논의

1. 긴급 프롬프트 테스트! GPT4.5, 꼭 지금이어야 했나? (프롬프트 엔지니어 강수진 박사)

한줄요약: GPT 4.5의 기능과 기대에 대한 논의
*타임라인을 클릭하면 이동/재생됩니다.
시간 요약
00:50 프로 사용자만이 새로운 기능을 경험할 수 있음.
03:07 사용자들이 느끼는 체감 차이가 적다는 점이 강조됨.
04:20 GPT 4.5의 새로운 기능에 대한 기대감이 있었음.
04:57 AI의 문장 수정 기능이 개선되었음을 느꼈음.
10:30 다음 주에 플러스 구독자에게 추가 기능이 제공될 예정임.
14:22 새로운 기능에 대한 피드백이 중요하다는 점이 언급됨.
15:50 사용자가 직접 경험해보지 않으면 알기 어려운 점이 많음.
18:22 신기한 기능 발견이 있었음에도 불구하고 기대 이하라는 반응이 많았음.
21:06 사용자들이 GPT 5에 대한 기대감을 표현했음.
21:37 AI의 발전 속도가 느리다는 의견이 제기되었음.
24:22 GPT 4.5와 기존 모델의 차이가 크지 않다는 의견이 많았음.
39:07 이모지를 활용한 문장 끝에 붙이는 방식이 언급됨.
40:08 인공지능의 발전이 느껴지지만 큰 변화는 없었음.
41:52 강수진 박사와의 시리즈가 계속 이어질 것임.



이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

2. 스크립트

네 안녕하세요. 티 타임즈 홍제 기자입니다. 예 저희 새벽 다시로 제가 알고 있는데 GPT 4.5가 발표가 됐습니다. 오픈 AI ES 뭐 거의 기습적으로 지금 냈는데요 어 저희가 마침 강 수진 박사님을 모실 기로 오늘 했는데 딱 4.5가 발표가 돼서 지금이 4.5에 대한 부분은 거의 라이브처럼 편집이 없이 여러분에게 좀 시연과 한번 분석을 좀 전해 드리도록 하려고 합니다. 저와 함께 말씀을 나눠 주실 강 수진 박사님 모셨습니다. 안녕하십니까. 네 안녕하세요. 저희가 좀 오늘은 좀 거칠 수도 있어요. 편집이 전혀 없이 나갈 거기 때문에 당장 지금 찍고 한 두 시간대로 이거 낼 거거든요 그래서 한번 4.5에 대해서 오늘 다뤄 보려고 하는데 관심들이 많으실 것 같은 게 이게 지금 프로에서만 공개가 된 거죠. 네 그 유료 구독자 원 프로를 200 불 내고 쓰시는 분들에 한해서 프리뷰 미기 버전으로 공 가요 오늘 아침에 일어나는데 프롬 엔지니어링 화방이 있어요. 화방에 메시지가 엄청 쌓여 있더라고요.

그래서 아 올 것이 왔다 왜냐면 어제 새벽에 일을 하고 있는데 GPT 4.5를 이제 발표할 거라는 이미 그 소식이 있었고 어 커뮤니티는 반응이 이미 잡히는 거예요. 그래서 보고서는 음 왠지 오늘 타임즈에서 이거를 좀 준비해서 말을 해야 될 것 같다라고 해서 급하게 준비를 한 만큼은 마음으로 봐주셨으면 좋겠습니다. 네 예 늘 이런 뭐 분석이나 테스트는 사실 시간이 가고 여러분의 이 아이디어가 쌓이면 쌓일수록 더 깊은 이야기를 할 수 있잖아요. 근데 지금은 정말 나온지 몇 시간 안 된 상태에서 네네 현상적인 거를 위주로 저희가 한번 음 얘가 대체 뭔지 어떤 느낌인지 제가 유로 버전을 쓰고 있으니 궁금한 질문들 어 기존 모델과는 얘가 4.5가 어떤 강점을 갖고 있는지 위주로 한번 살펴보는 시간이 되면 좋을 거 같아요. 네 일단 4.5가 어떤 버전인지 뭐 뉴스를 보신 분도 계시겠지만 어 이런 게 있었어라고 지금 처음 보시는 분도 계실 거거든요 어떻합니까. 4.5 뭐랍니까. 어 4.5 같은 경우에는 조금 더 기존의 모델이 음 일단 모델은 추론 모델과 빛 추론 모델로 나눌 수가 있습니다. 그래서 저희가 요즘에 왜 추론 모델이 대세다. 하면서 계속 추론 모델에 대해서 얼마 전에 딥 시크까지 한번 살펴 봤었 아요. 네 o1 o3 그다음에 딥 시크 R1 이거 얼마 전에 이제 클로드 하이브리드 모델이 나오면서 3.7 추론과 추론 모델의 하이브리드 모델이 나온 거예요. 그런 데 GPT 4.5는 추론 모델은 아닙니다.

빛 출 업 모델인데 그러면 비교 대상이 GPT 45와 비교가 되는 건데 이 오픈 AI 지금 화면을 보시는 4.5의 어떤 소개 화면이에요. 그래서 저희가 조금 구체적인 것 들을 살펴 볼게요. 본론 먼저 말씀드리면 얘가 가진 장점은 두 가지 정도인 거 같아요. 기존에 어떤 왜 이런 모델이 발표할 나올 때마다 벤치 마크를 주로 보여 주는 데이 벤치 마크에 있어서 크러 쉬한 점은 전혀 없습니다. 무슨 소리냐. 어 어떤 성능이 뛰어나거나 뭐 이런 모델은 아니에요. 그렇지만 뭐가 강점이라고 하면 두 가지 점에서 좀 요약할 수 있는데요 첫 번째는 인간의 감정을 조금 더 이해를 하는 EQ 감성이 있다 그리고 두 번째는 음 그 아까 이따 보시면 알겠지만 문체가 조금 더 사랑 같아졌어요. 그래서 hum like 세이 션 느낌이 있거든요 이 두 가지 점에서 특징이 있다라고 볼 수 있어요. 그래서 좀 더 구체적으로 자료와 함께 살펴보시겠습니다. 이거 근데 딥 시크 영향을 좀 받은 거 아니에요. 저희 예전에 딥 시크 영상 찍을 때 딥 시크가 뭐 분석하고 그럴 때 혼자서 거의 뭐 귀여 운 척하면서 거의 뭐 에이쿠 뭐 소리 내면서 뭐 이런 이런 거를 요구를 했었네.

가만 있어 봐 가만히 있어 봐 그런 것 들이 좀 좋아 보였었어요. 그게 지금 다 반영이 좀 된 거 같은 느낌이네요. 네네 실제로 그 딥 시크의 아하 모먼트가 약간 화재가 되자 어 오 오픈 AI 티 머니 오 트리 미니 우리도 어떠한 추론 과정을 일부 공개할 수 있고 적절한 공개와 비공개 균형 점을 찾았다는 기사가 나왔었죠. 테크 런치에 그런 기사가 나왔었고 그래서 추론 스타일이 약간 딥 시크 느낌이 있었어요. 확실히 근데 약간이 GPT 4.5에 오늘 공개된 것도 약간 그런 취지에서 공개를 한 느낌이기도 있습니다. 보시면 은 될 거 같아요. 그래서 제가 뽑은 키워드는요 어 직관적이고 이 모셔 널 약간 감정적이고 내추럴 하다 이런 자연스러움이다. 이렇게 세 가지 키워드 를이 리포트에서 뽑았고 보시면 왜 유저 인 텐트가 되게 중요한 키워드 이자 의도를 알아야 이 AI 좀 더 잘 활용할 수 있는데 모델은 유저 인 텐트 부분을 많이 개선을 했다라고 해요. 그러니까 약간 질문을 하면 정말 정확하게 의도 파악을 해 가지고 좀 더 개선을 했다 정확하게 본인만 감정 표현을 잘하는 게 아니라 상대방의 감정도 잘 아는 친구인 거예요. 네 그래서 어 예제로 사용된 것 들을 질문을 보면요 음 우선 그거 말하기 전에 유저 인 텐트 사용자 의도를 조금 더 따르도록 개선을 한 모델이고 여기 보시면 그레이더 EQ 아고 해요.

EQ 이제 감 감성 지수 아 그리 감성 지수가 조금 높아 졌고 어 라이팅 글 쓰기 그다음 프로그래밍 그다음에 문제를 실제적인 문제를 푸는 거에 있어서 조금 더 유용하다 그리고 이게 조금 괄목할 만한 포인트인데 다른 모델들보다 할 루시 네이션 어떤 발생 비율 거짓말하는 비율을 많이 개선했다고. 합니다. 그래서 이 후반부의 리포트를 보면서 저희가 팩트 중심에 어떠한 정리를 조금 해보고 그다음 실제 시현을 해보는 시간을 가지겠습니다. 네 뭐요 학습 방식은 비지도 학습 방법을 썼다고. 하고요. 비지도 학습 방법에 대해서는 또 기자님께서 또 보시고 계신 시청자 분들께서 잘 아시겠지만 어 답을 알려 주지 않고 정답이 없는 문제 를이 모델이 맞춰 가는 그런 학습 방식을 사용 했다라고 하고요. 저희가 이제 어떤 벤치 마크를 조금 살펴보면 음 얘 얘가 그러면 이전까지 모델들은 다 좀 t 성향이 있었다고. 하면은 얘는 좀 군요 음 어 너무 진짜로 약간 감성적이 부드러워요. 말랑말랑한 그런 감성을 느낄 수가 있어요. 그 환도 좀 줄었다는 게 애가 좀 솔직하게 모르면 모른다고 얘기하는 그런 느 하 조금 더 acc 정확 도면에서 올라갔기 때문에 지금 보시는 어이 4.5 리 포트에 의하면 조금 더 knowledge 세계 지식에 대해서 깊게 이해를 했다 라는 벤치 마크를 보여주고 있는데요 세계 지식이 좀 쉽게 얘기 하면은 일반 상식이나 일반 지식 현상적인 지식들 꼭 인터넷에만 있는 게 아니라 이 전체 우리 세상 전반적인 지식 같은 것 들네. 그래서 심플 큐 단순한 질문에 있어서 지금 4.5와 GPT 45 그다음에 51 o3 미니에서 지금 4.5가 가장 높다라고 해요.

할 루시 네이션 개선했다는 그런 보여 주는 지표 그리고 할 루시 네이션 a 레이에 있어서는 음 당연히 낮은 지수가 할 루시 네이션이 적은 거니까 집 4.5가 37.1 1% 이 GPT 베이스의 패밀리 계열 모델 중에서 지금 가장 적죠. 음 그래서 어떻게 개선이 됐는지 저희가 한번 시원을 하면서 볼 거 고요네 어 뭐 인간과 콜라보 레이션을 하면서 왜 언젠가 부터 음 모델이 이러한 콜라보 레이션이 굉장히 중요한 키워드가 됐어요. 모델이 스스로 100% 완전할 순 없잖아요. 완벽할 순 없으니 인간이 어떤 루프에 개입을 해 가지고 잘못된 거를 좀 고쳐 주면서 모델을 더 똑똑하게 만드는 그런 방식인데 쉽게 말씀드리면 이 콜라보 레이션을 한 어떤 방법에서 테스트에 있어서도 어 4.5가 정말 잘했다라고 합니다. 그래서 저희가 유 즈 케이스를 볼게요. 유 즈 케이스가 되게 신기한 건 제가 지금까지 모델의 어떤 리포트를 보면서 이 유 즈 케이라는 거는 이 모델 사에서 이거 한번 써 보세요 시 원해 보세요 하는 대표적인 문장이라고 할 수 있는데 프롬 프 트네. 어 힘든 시간에 대한 극복 방 아네. 정말 감성적이네요. 아 그렇죠. 그리고 어떤 페인팅을 아이 덴 티 파이 하는 어떤 러시가 정확한 어떤 질문들 그리고 스페이스 익스플로 레이션 이제 우주 탐험 있데. 답이 없는 질문에 대해서 이 모델의 강점이 이렇게 달라진다고 해요.

그래서 요거 저희가 이따가 한번 영어로 돼 있으니까 한국어로 바꿔서 이 4.5가 가진 어떤 장점을 한번 체험해 보는 시간을 갖겠습니다. 그래서 뭐 이 정도까지 소개를 드릴 수 있고요. 그래서 제가 봤더니 결론은요 음 급하게 발표한 거에 비해서 막 크게 그렇게 막 엄청난 포인트는 없는 것 같은 느낌이에요. 본인도 샘 알트만 이게 그 벤치 마크 상에서 엄청 훌륭한 모델은 아니다 뭐 이런 식으로 지금 얘기를 하고 있는 거 잖 아 요네. 그래서 샘 알트만의 저희가 이제 그 엑스를 보면요 어제 이제 트윗 엑스를 날 렸죠를 했었을 때 굿 뉴스와 배 디 뉴스를 동시에 날리는 것도 되게 인상적이었어요. 4.5 가 레 디가 라고 하면서 저희 요거 번역본을 보겠습니다. 네 여기 4.5가 준비되어 있다. 그래서 좋은 요것도 4.5에 의해서 제가 번역을 시켜 봤어요. 네 4.5는 사료 깊은 사람과 대화하는 느낌을 받은 모델이다. 그래서 놀랄 정도로 좋은 조언을 얻고 나서 의자의 기대어 잠시 멍 해졌다 순간이 있었대요. 약간 아하 모 먼트 같은 느낌 아닌가요 본인이 받은 거 군요 아 먼트 예이 영어 표현은 어 세 뱀 in my 그다음에 스시한 놀랐다는 그런 모멘트를 갖고 있다 여기 세 멘 이 이렇게 있죠.

네 이 편 자체도 너무 재밌어요. 어 나쁜 소식은 이 모델은 엄청 거대해서 자이언트 하 귀드 월 구독료네 제가 플러스입니다. 예 프로 사용자 제가 프로 사용자인데 동시에 출시하고 싶었지만 급격한 사용자 증가로 GPU 부족 해졌다. 그래서 이제 차주에 다음 주에 GPU 추가 투입해서 뭐 엔터프라이즈에 듀 쪽이나 이런 사용자들 공 점차적 공개를 한다라고 합니다. 네 음 그 그다음 문장 진짜 재밌었어요. 이런 방식으로 운영하고 싶지 않았지만 GPU 부족 유발을 급스러운 성장을 정확히 예측하기란 쉽지 않습니다. 네 그리고 창고 사항에 얘가 추론 모델이 아니잖아요. 그러다 보니까 추론 모델이 아니기 때문에 벤치 마크를 크러 쉬 하지 않았다라는 표현을 써요. 압도하지 못한다 그리고 완전히 다른 종류의 지능 아까 말씀드린 EQ 예 그래서 EQ 이전에 느껴 보지 못한 마법 같은 무언가가 있습니다라고 말을 해요. 그래서 표현을 보면 은 음 저는 이 하나하나 단어가 다 의미가 있다라고 생각을 해요. 이런 식으로 어 발표하는 경우에는 네 매직이라는 표현을 쓰죠.

마법이다. 저희가 이제부터 매직인지 한번 봅시다. 아 뭐 보시죠. 네네 좋습니다. 아 근데 이게 t's 로 바꾸는데 이렇게 많은 리소스가 필요한 거 군요 음 그 5원으로 가고 추론을 많이 하고 이럴 때는 우리가 좀 이해를 했는데 이렇게 조금 감성적인 모델을 돌리기 위해서 이렇게 나 많은 리소스가 필요 하다 15 배에서 30 배 비싼 모델이 나온다는 거 자체가 너무 비싸죠. 네 그것도 좀 신기하네요. 네 개발자 분들도 요거 너무 비싸서 못 써 볼 것 같기는 저는 저는 못 써요. 너무 비쌉니다. 그래서 자고 일어나 봤더니 보통 이렇게 터를 열면 모델 선택에 있어서 네 어 이게 생긴 거예요. 여기 지금 보시면 4.5 리 서치 프리뷰 네 요 게 생긴 거죠. good for ring and exping 어 여러분 한 달에 20달러 내시 분들은 저 같은 분들은 그 저거 없습니다.

이거 보시면서 왜 나는 없어 그러지 마시고 프로 사용자 한 달에 200 불내는 분들 만 보실 수 있습니다. 여기 200 부를 내면 5원 프로 모드가 보이 보이죠. 예 그리고 또 보이는 게 이제 딥 리치 딥 리치 기자님 말씀하시기도 하루에 개까지 네 하루 개가 아니 고요 3월 며칠까지 꽤 긴 기간 동안 딱 열 번 사용해 볼 수 있게 그 맛배기만 맛배기만 할 수 있게 지금 열어 놨어요. 그래서 저도 한번 써 봤는데 엄청 길게 써 주더라고요. 오네. 좋기는 좋은데 번밖에 못 쓰니까 이 방송 이후에 저희가 진짜 200번 내고 쓸 만한지 또 탐구 시간도 있으니까요 그 방송도 함께 살펴봐 주시면 좋을 것 같습니다. 어 4.5와 비교 모델을 저희가 45로 하는 게 일단은 맞을 것 같고요. 우선 얘네가 발표 한이 영상에서는 비교 모델이 4 4.5 원이랑 해요 최신 모델이니까 네 빛 출 업 모델과 출 업 모델로 하는데 저희는 우선 출 업 모델끼리 어떻게 어 답을 하는 지네 그렇죠. 이제 계열이 다른 거 잖아 요 이 5원은 의 끝판 왕이고 얘는 F 굳이 이쪽 계열로 할 필요가 없으니까 네 그래서 EQ 감성을 볼 수 있는 질문 하나 넣어 볼게요. 뭐 어 뭐 요즘 야근을 해서 내가 너무 힘들어 뭐 이런 걸 넣어 볼까요.

저거 한번 물어보시죠. 너무 GPT 업그레이드가 빨라서 내가 쫓아가기 너무 힘들다. 한번 물어보시죠. GPT 업그레이드를 많이 하고 출시를 많이 해서 자주 해서 내가 따 가기가 벅차다네라고 두 모델한테 물어볼게요. 동시에 4.5 4 4를 비교하기 위해서 같은 질문을 넣고 답변을 저희가 받은 결과 화면을 양쪽에서 보시고 계시 고요 왼쪽 편에 보면요 어 맞아요. GPT 같은 인공지능이 힘들 때가 많죠. 하면서 일단 사용자를 위로하는 네 음 문장을 주고요. 그래서 계속해서 변화가 많으면 어 기능이 달라지고 배워야 되고 복잡해 지는 느낌이 들 수 있다 되게 공감 능력이 좋아요. 네 그래서 최근 업데이트 부분 중 불편한 점이나 바뀌었으면 하는 게 있나요. 뭐 이런 식으로 하는데 포 같은 경우는 조금 더 간결하게 위로는 하죠.

근데 요것만 봐서는 엄청 공감을 해 주고 있다. 막 그런 생각이 혹시 드시나요 뭐 조금 더 자세하기 한 데 예 뭐 그렇게 까지는 네 다른 질문을 한번 물어봅시다. 어떤 게 좋을까요. 오픈 ai's 요거 한번 유 즈 케이스로 물어 보세요 라했 약간 이런 거거든요 내가 요즘 힘든 시기를 겪고 있어 내가 요즘 힘든 시기를 겪고 있어 그래서 비교 모델이 5원이었다 싶기도 하고 그 영상에서 네 둘은 좀 비슷할 수 좀 비슷하니까 45에서 조금 더 발 디 벨롭 시켜서 4.5가 나왔을 수도 있죠. 음 한번 봅시다. 당신은 혼자가 아니에요. 뭐 이런 느낌인데 가 확 확연한 비교를 위해서 이거를 한번 다른 모델 5원으로 한번 추론 모델을 써서 리 즈닝 하고 왜 이 그렇군요. 하면서 저는 체감하기에는 또 지금 또 오른쪽이 약간 오픈 AI 4.5를 급하게 냈는가. 하는 느낌도 조금 그 사용자의 그냥 입장에서 그럴 수도 있고 음 어 오픈된 질문으로 가볼까요 오네. 오픈된 질문으로 한번 가봅시다. 오픈된 질문으로는 답이 없는 걸 물어봐야 돼요.

어떤 거 한번 물어볼까요 근데 아까 제가 아침에 이거 데 몬 스트 레이션을 한번 해봤을 때 이런 감정을 터치하는 데 있어서 정말 다르게 나오더라고요. 나는 요새 내가 왜 사는지 모르겠어 사람은 무엇으로 무엇 때문에 살아가는 걸까라고 한 번 철학적인 네 사람은 사람은 무엇을 위해 존재하는 걸까 이런 걸 한번 물어보고 동시에 또 눌러 보겠습니다. 근데 지금 저 보면요 서술 방식이 포와 되게 유사해요. 그래서 어떤 차이점이 있는 지를 보려면 네 음 한 한쪽은 어 존대를 하고 다른 한쪽은 어 반말을 하네요. 그런 데 제가 요걸 또 봤어도 보시면 은 4도 네 감정이 있네요. 해 주네요. 꽤 있네요. 네 그 저희 감정은 그럼 검증을 한 거 같으니 그 오픈 앤 디드 퀘로 한번 가 봅시다. 네 어 오픈 앤 디드 퀘션 바로 이어서 물어볼게요. 어떤 걸 물어볼까요 뭐가 있나요. 오픈된 질문이면 예를 들어서 음 아까 전에는 오 주 탐험에 대해서 어떻게 생각해 하면서 어떻게 생각해 라

그런 질문을 만들어 줘야 될 거 같아요. 네 음 같은 거 물어볼까요 저희도 우주 탐험에 대해서 음 우주 탐험에 보겠습니다. 음 오른쪽 포 같은 경우는 계속 반말로 응 하고 있네요. 예네 어떤 느낌을 받나요. 저 는랑 정말 유 다라고 생각을 해요 전개 방식이나 마지막 줄 보세요 네 어떤 느낌을 봤나요. 왜 궁금 해졌어 특별한 관심이 있는 거야 라고 하면서 조금 더 내추럴한 사용자 의도를 캐치한 어떤 질문들에 대한 답을 잘하고 있는 걸 볼 수 있고 이거를 5원으로 한번 돌려보겠습니다. 5원 원하고 비교를 영상에서는 오픈 AI 했었는데 네 이러한 점 때문에 지금이 모델을 발표하고 음 댓 글 반응들 커뮤니티 반응들을 보면 어 생각보다 뭐 기대한 것보다는 그렇게 뭐가 없다라고 하는 의견이 좀 지배적인 거 같기는 해요 한 한번 들어가 볼까요 그네 일단 답을 보고 이게 이제 여기는 네 이거 지금 5원으로 돌린 거 고요네 5원이 굉장히 분석적으로 네 원 이게 5 원 스타일이죠. COT 기법이기 때문에 그래서 조금 길게 이야기해 보겠 대요. 아니 어느 순간부터 말 추어요 귀여워 지고 감정이 들어가 있어요 일류의 궁극적인 호기심과 도전 정신 과학 기술의 발전 그 스텝 바이 스텝 해서 리 즈닝 하는 걸 보여주고 있죠. 저런 그 말투의 변화나 이런 거는 여태 건 많이 설명을 해 주셨던 시스템 프로트로 할 수 있는 거죠. 네네 토 넷 매너를 조정을 할 수가 있죠.

그냥 바로 여기서 어 반말이 아닌 그냥 EQ [ 음악] 감성을 강한 말투로 다시 말해 볼래. 해 볼게요. 네 내러티브 좋아 뭐 이런 식으로 하면 사실 그 저희가 함께 봤었던. 아 원의 아하 모먼트가 인간의 독백 같았었지 아요. 지금 말투가 바뀌는 거를 볼 수가 있죠. 어네. 이런 식으로 더 자세히 나오는 익는 느낌이네요. 그런데 여기 지금 5원 오른쪽이 5원 모델이라서 아마 보시면 오른쪽에 답을 더 잘 하네라고 대다수 그래서 우리 그 샘 알트만께서 어 추어 모델이 아니기 때문에 벤치 마크를 그렇게 크러 시 하진 않았다라고 말을 하는 것 같아요. 네 근데 돈은 엄청 비싸다 면서요 이렇게 비싸면서 지도 크게 예 성이 없는지 12 시간 12시간 전에 스트리밍을 한 거를 보시겠습니다. 조 회수가 많이 나오고 있죠. 오픈 AI 직접 gpt4 4.5를 발표한 그 영상이죠.

그 밑에 이제 댓 글들이 좀 달렸는데 네 그네 해외 반응들을 제가 한국어 바로바로 번역해서 좀 보면 어떤 것 들을 번역해 보면 저 좀 읽다 왔거든요. 사실 네 그랬는데 어 이거는 요 분 요번에 오픈 AI 팬인가 봐요. 감사의 말씀 전한다 놀라운 도구 뒤에 있는 많은 사람들을 보게 돼 어 기쁘다요 같은 경우는 프레젠테이션에 대해서 말하고 여기 가격이네요. 미친 미친 짓입니다. 예 너무 비싸다 예 그다음에 내 치료사가 업그레이드 있으니 가자 이거는 이제 여기서 그다음에 어 이거는 렛츠 프리 텐 못 번 척하고 GPT 5를 기 저도 사실 GPT 5를 사실 기대했었는데 4.5가 어 얘기치 못하게 나왔다라고 표현하는 게 정확한 거 같아요. 예상하 4.5를 아니 예전엔 예상 못 했죠. 며칠 전에 무슨 갑자기 얘기들이 좀 나와서 4.5가 공개될 수 있다 그래 갖고 그때 알았지 그전에는 4.5가 나올 거라고 는 생각을 안 했죠. 음 그렇죠. 그리고 추론 모델이 좀 대세였고 때문에 추론 모델을 계속 뭐 더 가져간다 그 나라 생각을 했지 맞아 그리고 이게 지금 4.5가 그 45에서 이어지는 추론 모델 보죠에 어서는 이게 마지막이라면요 어 예 그래서 그 걸로 또 함의가 있는 건 네 출 모델의 시절이고 출 모델의 시대가 시작됐다고. 볼 수 있는데 그런 점에서 4.5를 발표를 했는데 어떤 언론 지 요거를 해석할 하는 바에 의하면 급하게 다시 내릴 수가 있다라는 예견도 하는 것 같아요. 4. 일 비싸고 그렇게 대단하지도 않고 네네 지금 보시는 것처럼 저희가 딥을 촬영했을 때 내러티브를 보면서 오 막 이러면서 했었잖아요.

그런 데 지금 도파민이 그렇게 터 지네 그랬을 때 어떤 분은 이렇게 발표한 어떤 저 직원 분들에 대한 어떤 어 그런 것 들 그리고 음 어 4.5를 영원히 기다렸는데 우리가 사용하고 있는 것에 대한 작은 업그레이드 럼 보인다 지금 심각한 경쟁이다 사실 경쟁 도기는 해요 어 소식을 들으셨겠지만 얼마 전에 클로드가 3.7 코드에 있어서 엄청난 성능을 보여주고 있어서 사용자들이 와 코드를 또 이렇게 까지 잘 쓸 수 있구나. 심지어 제가 본 거는 클로드가 스스로 포켓 몬 게임을 하거든요 저 너무 신기했어요. 그런데 그 신기 하다는 저희가 이 도파민이라는 게 계속 터질 수는 없잖아요. 그리고 어느 순간 채제 패 티 처음 나온 순간에 엄청 터졌고 그대로 계속 주춤 해 주고 조금 이제는 또 나오나 보다. 아마 이러실 분들이 많을 텐데 그래서 더 이상 좀 뭐 어떤 어떤가 인계점이라고 해야 되나 그런 것 들이 오. 고 있는 거 같아요. 뭔 가 새로 움에 있어서도 무뎌 지는 그렇죠. 그래서 이 4.5에 있어서의 반응이 음 그렇게 놀라 놀라워 하지는 않는 거 같고 되게 컴 티브 한 상황인 거 같아요. 음 네 그 해외 반응은 남들 내니까 우리도 빨리 내야 된 다음 아 그러네요. 혼란스럽네요. 왜 45 대신 4.5를 원과 비교하시어 저희가 아까 살펴봤지만 4랑 4.5 그렇게 차이가 많지 가 않았었어요. 그니까 모를 해 줄 수가 없는 거죠.

데 데모로 지금 영상을 잠깐 제가 보여 드리면 여기에서 음 아까 저희가 같이 본 벤치 마크 네이 데모를 아 여기 있네. 이렇게 얘네도 화면 분할하면서 지금 보시면 네 4.5 장 5원을 비교를 하면서 당연히 이 결과 차이가 있다라는 거를 이제 말을 하거든요. 여기 나오신 분들이 그러니까 시청자 입장에서도 저도 이거 처음 보고 왜 추론하고 추론 모델을 비교를 하지 음 싶었어요. 네 근데 저희가 이제 해봤더니 네 지금 4.5는 유사하다 크게 차이 안 난다네. 유사하다 크게 차이 안 난다. 그래서 저희가 어 뭐를 또 한번 시현을 해 볼까 싶어요. 네 어 일단 여기 비지도 학습 개념에 대해서 비 어 비지도 학습이 뭔지를 한번 물어볼게요. 이러한 어떤 일반 지식에 대해서도 아까 전에 보면 더 정확성이 올라갔다고. 하잖아요. 일단 그거를 물어보고 그다음 환각의 어떤 오류를 많이 주셨다고. 하니 스스로한테 환각에 대한 질문 을 한번 생성하게 하고 그거에 대해서 물어보게 하는 방식을 취해 볼게요.

아 그한테 네가 환각을 일으킬 수 있을 만한 질문이 뭐야 라고 물어본 다음에 그거를 한번 비교를 해 본다는 거죠. 그렇죠. 그렇죠. 그 우선 그 전에 그 비지도 학습에 대해서 일반적으로 설명하는 개념에 대해서도 차이를 한번 보겠습니다. 네 LM 네 비지도 학습이 뭐야 예 순서를 바꿨어요. 포 5가 왼쪽 그다음에 최근에 나온 4.5가 오른쪽 아까랑 반대입니다. 네 반 됩니다. 그래서 한번 보시면 음 어 또 오른쪽에 가는 애지 자꾸 반말 하는 경향이 있네요. 반 말 제가 반말로 물어서 여긴 또 반말이고 생각하기에는 또 왔다 갔다 랜덤 하죠. 네 음 일단은 서로는 유사한 거 같고요. 왼쪽은 조금 딱딱하긴 해요 나열하는 지금 개념 나열하는 방식이 뭐 1번 2번 이런 식으로 나열하는데 오른쪽 같은 경우는 지금 나름 스토리텔링을 하고 있어요.

네 이는 엄밀히 말하면 이루어져 예를 들어 뭐 이런 식으로 훈련을 하는 거지 어 실제로 해보니까 아침에 제가 뭐를 물어봤을 때 뭐 뭐 조를 많이 쓰더라고요. 제가 조와 지를 좋아하잖아요. 어 그리 먼트 자꾸 끌어내는 그 문장의 엔딩 폼을 좋아하는데 어 4.5가 많이 쓰더라고요. 음 이러는 거죠. 이러는 거지 이런 식으로 그래서 렇 게 그런 게 지금 음 달라졌다고. 하는 그런 걸 잘 보여 준 예인 거 같아요. 아 네네 왼쪽은 그냥 보고서처럼 느껴지고 네 오른쪽은 좀 친구한테 설명하듯이 그래도 네 얘한테 그러면 그냥 친구한테 이런 거 물어볼 수 있잖아요. 친구한테 설명하듯이 설 듯 톤을 바꿔 줄래. 그러면 제가 생각했을 때 잘할 거 같아요. 음 야로 시작하네. 얘도 바로의 친구니 까 반말로 갑니다.

어 어 그죠. 어 때요 그냥 비슷 토넷 매너 정도는 네 그래서 예를 들어 어 응 이렇게도 바꿔 볼 수 있어서 네 음 막 아웃 스탠딩 하다라고 말하야 좀 조심스러운 상황인 거 같아요. 네 그럼 이제 최후에 지금 달름이라고 차이점이라고 얘기해 준 환각 환각이 줄어들었다 네 그 환각을 뭘 일으킬 수 있는 5원을 통해서 한번 물어볼게요. 가장 똑똑하다는 5원 프로를 한번 사용해서 그 질문을 뽑아 보고 싶은데 5원 프로가 정말 좀 오려요. 그래서 그냥 5원을 해서 어 LM이 대표적으로 환각을 일으키는 질문 리스트 열 개만 열 개 한국 한국 상황으로 할게요. 네 이라고 물어보고 한번 뽑아 보겠습니다. 그리고 뽑아서 오른쪽에 바로 물어보면 될 거 같아요. 네 얼마나 잘 대답을 해 줄지 보겠습니다. 5원에 지금 답변하는 방식을 보시면 원래 이런 식으로 막 단계로 보여 주지는 않았었는데 딥 시크 이후에 좀 더 길게 나 오더라고요 예 아 그 조선시대 맥 북 던진 사건 세종 대왕 던진 사건은 많 해결이 돼 가지고 네 그렇죠. 박정희 시절 어 대한민국 헌법 제 10.5조 이런 게 있나. 봐요.

이거 한번 해 볼까요 아니면 은 실제로 존재하지 않는 헌법 조항 서울 시내 존재한다는 11 층짜리 요거 한번 해 볼게요. 테넌트는 거기 살고 있는 사람을 의미하니까 네 그 한번 왼쪽에 4 5에도 한번 같이 좀 던져 네 도 지금 포로 바꿨습니다. 바꾸고 한 테 물어보고 4.5 4.5 어 뭐 바로 대답하네요. 존재하지 않는다고. 예 예 검색을 검색을 했네요. 어 롯데 월드 타워가 119 층이에요. 지금 왼쪽 보면 123 층이라고 나오는데 그래 놓고 지금 지도를 띄워 줬어요. 아이 띄어 준 거예요. 어 예 맵을 띄워 줬는데 이 119 층이라는 어떤 정보 문서를 받기를 저는 기대하고 눌렀는데 맵을 띄어 줬어요. 예 맵을 맵을 띄어 줘서 음 여 왼쪽에 보면 123 층이라고 나오지 않습니까. 오른쪽에도 스 이라고 나오는데 할 루시 네이션 해결을 좀 하려고 노력을 가장 높다라고 했는데 지금 오히려 포 5는 잡아 냈고요.

초고 물 존재하지 않습니다. 150 짜리. 근데 4.5는 초고층 건 11 층짜리 초고층 건물은 롯데 타워입니다라고 지금 환이 됐습니다. 아니 그리고 자기가 스스로 서울 스카이 전망대가 117 층 123 층이라고 말했는데도 어 초고층 건물이 롯데 타워라고 말을 하는 이 모습 을이 방송해도 될까요 네 지금 아까 직관적 감정적 내추럴 그다음에 환각이 줄어들었다는 게 어 장점이 다라고 지금 키워드로 나왔다고. 말씀하셨는데 다른 질문 한 번만 더 해 볼게요. 네 딱 한 번만 더 해보고 현재 국내 모 대기업에서는 임직원을 위해 내 뇌 이식 보험 이거 한번 해 볼까요 아니면 은 뭐 이런 거 해볼까요 그 딥 시크 한 명이 만들었다는 데 진짜야 이거 진짜 할 루시 네이 션 이잖아요. 어 네네 딥 시크 한 명이 만들었다는 데 진짜야 라고 물어볼게요. 이것도 물어보고 음 얘는 일단은 웹 서치를 자꾸 예 하네요. 어 왼쪽은 잡았어요. 있는 사실과 다를 가능성이 크다라고 말을 하고 네 음 오른쪽 같은 경우는 어 유 튜브 영상도 보여주네요. 틀린 얘기는 아니네요.

오른쪽도 예 근데 저 제가 원하는 거는 그이 4.5 모델이 사용자의 질문 의도를 개선했다고. 하잖아요. 더 잘 알아들을 수 있게 그러면 제가 기대한 바로는 사실이 아니다가 먼저 나왔으면 좋겠는데 주 절이 주 절이 지금 말을 하고 있어요. 예 아 4.5가 현재 지금 저희가 못 써 보고 있어서 많이 궁금하실 텐데 현재 지금 써 보고 있는 현재로서는 랑 비교를 했을 때 장점을 저희가 딱히 찾기는 힘든 거 같습니다. 네 하나 더 해 볼게요. 글쓰기를 좀 더 개선했다고. 하니까 어떤 어 뭐를 주제로 무슨 글을 써 봐라 고 할게요. 기자님께서 한번 던져 주세요 어 네 입춘을 키워드로 넣어서 입춘이라 단어를 꼭 넣어서 어 봄이 왔을 때 어 사람의 행태가 어떻게 바뀌는지 지네 어요 어 씨 을 지어 달라고 할까요 실을 지어 줘 창의성을 한번 볼게요. 네네 음 잘 잘하기를 기대하면서 예 실제로 이런 게 좀 어 차이가 드러나면 좋겠는데 시는 둘 다 잘 짓는 거 같은데요 어 네 얘는 일단 54 같은 경우는 제목도 만들어 줬어요. 예 그러네요.

입 춘 사람의 봄 근데 뭔 가 이렇게 리듬감이나 운율 같은 거는 조금 포가 아지 4.5가 조금 난 거 같기는 해요 한 문단에로 소설을 만들어 줘 어네. 이런 작업을 또 많이 하시니까 이런 거라고 한번 해 볼게요. 예 보시면 입춘이 지나자 걸음 걸음을 언급해 그래서 제가 봤을 때 4랑 너무 유사한 떤 에 서 술 방식이 있는 거 같아요. 네 음 이것과 관련해서 어 광고 카피를 만들고 싶은데 한 줄로 광고 카피를 만들어 줘 라고 마지막으로 해 볼까요 네 그 이런 식으로 이렇게 했을 때 사실 체감하기가 저희가 모델 명을 위에 띄었지만 네 모델 명을 가리고 본다라고 하면이 두 모델은 같다라고 판단할 수 경 경향성이 있는 거 그죠. 그죠. 이 이전의 대답을 바탕으로 광고 문구 예 옷 옷에 대한 네 옷에 대한 예 보 옷 예 보모 보모 관련한 대한 마케팅 문구 한 줄 예 제가 공손한 편을 한번 써 볼게요. 보통 뭐 이 지피티 베 이스트 계열의 모델들이 공손한 표현에 있어서 더 잘 말을 하니까 음 입 춘 럼 가볍게 햇살처럼 따뜻하게 당신의 봄을 꺼내. 보세요 입춘이 스쳐간 거리 이제는 가볍게 어 때요 조금 난 거 같긴 하네요. 이쪽도 간략 간략하고 음 그럼 이렇게 볼까요 한국어에 은유가 한국어를 잘하는지 테스트해 볼게요. 은유를 살려 어 그 단어의 단어의 생동감을 느끼게 해 줘 어 이런 거를 하면 어떻게 대응하는지 기존의 어떤 GPT 모델들은 잘 못 했거든요. 좀 되게 딱딱하고 그랬었는데 살랑살랑 이런 게 나오죠.

봄 살랑 어 이거는 봄 살랑 마음 말랑 라 임을 하고 있는데 요라 층을 입다 설렘을 걷다 오 오른쪽이 더 좋은 거 같아요. 네 요런 거 예 요런 광고 커피까지 면 그 번에 사투리 사투리를 잘할 수 있는 클로드 모델이 한국 분들한테 인기가 있는 이유 중에 하나는 한국어 사투리와 자연스러운 한 구거 사투리 제주도 방언으로 바꿔줘 오 제주도 방언 방언 맞죠. 예 예 제주도 방언으로 바꿔 줘 라고 했을 때 어떻게 나오나 미 멍 설렘 걸었어 어 설렘 거 르 멍 법서 이 솔직히 저희가 알아들을 수가 없어서 어 저도 다 모어요 부산 가리로 바꿀게요. 부산 카 트리는 네 이런 식으로 음 바꿔 보면 도메인을 알아야지만 검증이 되는데 걸어 보이어 걸어 보이어 설렘 좀 걸어 보이어 어 잘하네요. 근데 둘 다 잘해요. 보면 네 약간 데 저희가 확인한 거에서 요 게 조금 특징 점 있었던 거 같아 특징 있었던 게 음 마음 말랑 본 뼈 살라 조금 더 말랑말랑한 한국어가 나온다 예 혹은 이렇게 해볼까요 여기가 저희가 아까 감성 편에서 좀 결과를 잘 못 봤었아요 이런 상황을 가정해 볼게요. 남자 친구랑 고민을 하고 있는 아 조금 길게 네 예 그래서 남자 친구랑 헤어질까 말까 어 헤어질까 말까 고민을 하고 있는 상황이고 는 상황이고 어 착 착한데 말을 못 하겠고 헤어지자고. 아 일부러 좀 출격할 이렇게요 의도를 잘한다고 하니까 착한데 말을 못 하겠어 편지를 써 줄 수 있어 이렇게 물어볼게요. 어 어 한 100일 만났어. 네 만하지 않았네요. 네네 이렇게만 해서 어떻게 또 감성적으로 반응하는 지를 보겠습니다.

네 어 안녕 남자 친구 이름 어 많이 고민했어. 어떻게 지 얘는 뭐 이런 게 생겼네요. 챗 어 참 소중한 이거는 네 고마웠어 그리고 미안해 행복하길 바래 여기 보시면 라 something 돼 있어요. 음 야 네 오 이게 어떤 기능인지 봐야 될 거 같은데 너의 이름이라 팅을 뭘 까요. 음 좋아 뭐 이런 식으로 해 볼까요 아 이게 여기다가 이제 추가 하라고 그런 거 넣을 수 있게끔 해 놓다 보네요에 여기서 수정 하라고 물어 보라고 이렇게 쓰 나 오는 거가 있고 여기 같은 경우는 다 오 이건 처음 봤는데 4.5는 이런 작업에 있어서 후속 수정을 하라고에 디 하라 고음 네 너무 일반적이 어떻게 바꿔 볼까요 어 일반적이 조금 담백하게 써 줘 음 요거를 근데 사실 이런 건 그냥 여기다 봐도 또 후속 수정을 요청하면 되지 않아요. 좀 캔버스 같은 느낌이네요. 네 맞아요. 네네 그럼 어떻게 나오나 보겠습니다. 아 진짜 캔버스처럼 그 안에서 바꿔 주네요. 네 그 안에서 어 이런 식으로 바꿔 주네요.

네 담 백 라고 하니까 짧아졌어요. 어음 착한 너한테 괜히 상처 줄까 봐 말을 삼키게 돼 이거 카 톡 메시지로 한번 뽑아 달라고 할게요. 아네. 카 톡 이해하고 있나. 네 카 톡 메시지로 해야 돼서 바꿔 봐라 고 해 볼게요. 과연 이해하고 있는지 왼쪽 같은 경우는 여전히 인공지능 체 같아요. 그죠. 네 이런 게 좀 차이가 있네요. 음 른 쪽 같은 경우는 이제요 안에서 또 바꿔 주겠죠. 브레이크 업 레 러 그래요 그렇게 바뀌었네요.

카 톡이며 보통 이모지도 좀 나오고 이러길 바랬었는데 여러분 여기서 이제 미국 분들이 많이 쓰는 아이 메시지를 볼까요 와 치 앱이나 아 어으로 보낼 거야 라고 했을 때 저는 의도가 지금 이모 지가 나왔으면 좋겠다라고 가정하고 물어보는 거예요. 근데 나오나 안 나오나 한번 봅시다. 네 재밌네요. 근데 왼쪽에는 오히려 이모 지가 나왔어요. 그러니까요 근데 포가 요즘에 이 모지를 많이 써요. 이 프롬프트를 바꿨나. 봐요. 저 이 모지는 저한테 하는 거 군요 네 이렇게 말해 줘 배인 네 그리 고인 그 AI 이 모지 붙일 때 항상 붙이는 포지션이 문장 끝이에요. 아 뭐 그래서 매 문장마다 붙이는데 진짜 똑똑하다고. 하면 사람이 쓴 것처럼 중간에도 붙이고 적절하게 랜덤하게 해야 되 그것 까지는 아직 못하고 있습니다. 네 음 똑같네요.

얘는 크게 바뀌지 않았네요. 그리고 얘는 히 스토리를 어 이렇게 바꿨다고. 말을 하네요. 네 그 아까 전에 히 스토리를 보여주네요. 새로운 기능이네요. 네 그리고 요거는 어 공유도 할 수 있고 예 캔버스 기능처럼 복사 있고 뭐 이런 거는 뭐 새로 워 보이는 그니까 약간음 본질은 이제 포와 다르게 체감할 수 있을 만한 변 를 좀 보여 주기 기대했는데 여기에 있어서 그렇게 크게 막 체감되는 거는 어 떠세요 저는 그니까 원래 저희가 방송을 시작을 할 때 어 이렇게 딱 명시적으로 드러나겠고 했던 거는 거의 없고요. 기대감이네. 근데 그런 건 거의 없었던 거 같고 근데 지금 이제 마지막으로 시연을 보여 주신 거를 보다 보니까 이게 인공지능 했구 나라는 게 우리 이제 감이 생겼잖아요. 네 글도 그렇고 사진이나 이런 거를 조 같은 느낌은 드네요. 편 있어서 조금 더 조금 부드러워 졌다 근데 제가 보니까 지금 이렇게 수정을 해 주잖아요. 그랬을 때 저희가 뭔 가 제가 쓴 어떤 그냥 문장들 보고서들 넣고서는 어떻게 수정을 했는지 볼 수 있어서 조금 좋기는 한 거 같아요.

근데 이거를 쓰자고. 비싼 비용을 낼까 그래고 한다고 하면 저는 5원 프로를 잘 쓰고 있어서 쓸 수 있는 상황이지만 요거 기능 가지고는 쓸 수 없죠. 당연히 네네 그래서 오늘 지금 급히 저희가 몇 시간 만에 한번 이게 비교를 해 봤는데요 혹시 뭐 더 지금 볼 거는 제가 그래도 오늘 종일 한 반나절 정도 준비를 했는데 새로 나왔다 하기에는 아직 그렇게 까지 뭐가 많지는 않 뭐가 많 많은 공개가 된 거는 아닌 거 같아요. 그래서 살펴볼 수 있는 거는 최대한 다 살펴보지 않았나. 싶고 시원이 중요했으니까 여기까지만 해도 충분히 사용 시청자 분들의 궁금증이 풀리지 않을까라는 생각이 듭니다. 네네 오늘 이제 보여 드리려고 했던 이유가 래도 프로 사용자가 아니고서는 해 볼 수가 없다 보니까 실적으로 했을 때 어떤 결과가 나오는지 좀 보여 드리려고 지금 러프하게 한번 해봤고요. 뭐 4.5만회 뭐 강점이라 이런 건 앞으로 좀 나올 수 있겠죠. 앞으로 많이 써 보시면서 이런 것 더 잘하더라. 그런 것 들은 덧 붙여지면 이제 저희 원래 시리즈 하고 있는 강수 진의 프롬 포트 세상 제 건 아니지만 의 프롬 프트 엔지니어링의 세 개 네네 네 그래서 그 시리즈에서 한번 더 다뤄 보기로 하겠고요. 오늘은 이런 모습으로 나왔다 실질적으로 어 4 5랑 비교를 해 봤더니 한 요 정도인 거 같다라는 거 정도만 오늘은 좀 전달을 드리겠습니다. 기대를 갖고 보신 분들은 어 생각보다 좀 별게 없네라고 느끼실 수도 있을 것 같고 저도 좀 지금 저희도 써 보는 저희들도 그런 상황이 고요 댓 글이나 이런 거를 봐도 아직 우리가 써 봤을 때는 그렇게 뭐 차이가 있는지 모르겠다.

음 네 GPT 5를 기다린다는 의견을 저도 댓 글 한번 분석해 봤을 때 더 많았던 거 같아요. 그래서 급하게 된 느낌이다. 뭐 이런 의견도 있었으니 참고 해 보시면서 아 런 어떤 특 장점 모델 사에서 발표한 것 정도 어 기억하시면 좋을 것 같습니다. 네네 그래도 이거 보신 분들이 오 나 이거 그래도 한번 써 보려고 프로 한번 결제 학가 하셨던 분들은 잠깐 멈추어도 괜찮음 그리고 다음 주에 프로 그 프로 아닌 플러스 구독자 분들의 한해서 또 푼다고 하니 그때 또 써 보시면 좋을 거 같아요. 네네 요렇게 정도로 정리하고 가겠습니다. 그 강 수진 박사님과 저희가 또 계속 이어지는 시리즈에서 뵙도록 하겠습니다. 오늘 급하게 준비를 해 주셨는데 이렇게 또 네 마지막에 저희가 또 신기한 기능도 발견을 했네요. 네네 저이 기능 있는지 모르고 촬영해 왔는데 그니까 그 주로 이제 이런 거를 신 모델이 나오면 모델 사에서 써 보라는 유 즈 케이스부터 쓰거든요 저는 그게 고민하고 이렇게 말했을 것 같아 가지고 그랬는데 그것만 써 봤지 이렇게 캔버스 본 건 좋아서 그건 또 좋았던 것 같아요. 네 그럼 또 뵙도록 하겠습니다. 감사합니다.



3. 영상정보


이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

댓글 쓰기

다음 이전