인공지능의 언어능력은 어느 정도 수준에 도달했나
페이지 정보

본문
<a href="https://pilatesguide.co.kr/shop/index.php?no=191" target="_blank" rel="noopener" title="정자동필라테스" class="seo-link good-link">정자동필라테스</a> 튜링 테스트’라는 게 있다. 상대의 정체를 알지 못한 상태에서 대화했을 때, 인간인지 기계인지 구분할 수 있느냐에 따라 AI 성능을 측정하는 테스트이다(1950년 천재 수학자 앨런 튜링이 고안했다). 그동안 ‘인공지능이 사람처럼 말한다’는 일회적인 증거는 많았다. 올해 초에 대규모로 튜링 테스트를 진행한 실험 결과가 미국에서 나왔다. 참가자들이 최대 5분 동안 각각 인간, 인공지능과 대화를 나눈 뒤에 어느 쪽이 진짜 인간인지 선택하게 했다. 인간 페르소나가 부여된 오픈AI의 GPT-4.5의 경우, 참가자의 73%가 이쪽(인공지능)이 인간 같다고 판단했다. 마찬가지로 사람을 연기한 메타의 라마(LLaMa)-3.1은 참가자의 56%가 (인공지능이) 인간이라고 선택했다. ‘인간처럼 의사소통하기’에서 AI가 사람을 이긴 것이다.
‘쓰기’로 특정해서 얘기를 해보면, 미국 대학원에 진학할 때 보는 GRE라는 작문 시험이 있다. 6점 만점에 인간 평균이 3.5~4점 정도이다. GPT-4에게 문제를 제시하고 답안 작성을 시키면 바로 인간 평균보다 높은 점수를 받을 만한 에세이가 나온다. 프롬프트를 입력해 뭔가 지시를 주고받으면서 수정하기 이전인데도..
‘쓰기’로 특정해서 얘기를 해보면, 미국 대학원에 진학할 때 보는 GRE라는 작문 시험이 있다. 6점 만점에 인간 평균이 3.5~4점 정도이다. GPT-4에게 문제를 제시하고 답안 작성을 시키면 바로 인간 평균보다 높은 점수를 받을 만한 에세이가 나온다. 프롬프트를 입력해 뭔가 지시를 주고받으면서 수정하기 이전인데도..
- 이전글우리의 몸과 마음: 건강과 행복의 관계 25.08.13
- 다음글사회의 어둠과 빛: 불평등과 희망 25.08.13
댓글목록
등록된 댓글이 없습니다.