[ad_1]

입주 전보를 보낸 후 미디어 출연OpenAI는 출시 회사 자체에서 생성한 텍스트와 같이 사람이 작성한 텍스트와 AI가 생성한 텍스트를 구별하려고 시도하는 도구 채팅GPT 그리고 GPT-3 모델. 분류기는 특별히 정확하지 않습니다. 성공률은 약 26percent라고 OpenAI는 지적합니다. 그러나 OpenAI는 다른 방법과 함께 사용할 때 AI 텍스트 생성기가 남용되는 것을 방지하는 데 유용할 수 있다고 주장합니다.

“분류기는 AI가 생성한 텍스트가 인간에 의해 작성되었다는 잘못된 주장을 완화하는 것을 목표로 합니다. 그러나 여전히 많은 제한 사항이 있으므로 기본 의사 결정 도구가 아닌 텍스트 소스를 결정하는 다른 방법의 보완 수단으로 사용해야 합니다.”라고 OpenAI 대변인은 이메일을 통해 TechCrunch에 말했습니다. “우리는 이와 같은 도구가 유용한지에 대한 피드백을 얻기 위해 이 초기 분류자를 사용할 수 있도록 만들고 있으며 향후 개선된 방법을 공유할 수 있기를 바랍니다.”

생성 AI, 특히 텍스트 생성 AI에 대한 열광이 커지면서 비평가들은 이러한 도구의 제작자에게 잠재적으로 해로운 영향을 완화하기 위한 조치를 취할 것을 촉구했습니다. 미국에서 가장 큰 학군 중 일부는 금지 네트워크 및 장치에서 ChatGPT를 사용하여 학생 학습에 미치는 영향과 도구가 생성하는 콘텐츠의 정확성을 두려워합니다. 그리고 다음을 포함한 사이트 스택 오버플로가 사용자를 차단했습니다. ChatGPT가 생성한 콘텐츠를 공유하는 것에서 AI가 사용자가 모호한 답변으로 토론 스레드를 너무 쉽게 범람하게 만든다고 말했습니다.

OpenAI AI Textual content Classifier라고 불리는 OpenAI의 분류기는 구조적으로 흥미롭습니다. ChatGPT와 마찬가지로 웹에서 공개적으로 사용할 수 있는 텍스트의 많은 예에서 훈련된 AI 언어 모델입니다. 그러나 ChatGPT와 달리 ChatGPT뿐만 아니라 모든 텍스트 생성 AI 모델에서 텍스트가 AI에 의해 생성되었을 가능성을 예측하도록 미세 조정됩니다.

보다 구체적으로 OpenAI는 OpenAI 자체를 포함하여 5개 조직의 34개 텍스트 생성 시스템의 텍스트에 대해 OpenAI AI 텍스트 분류자를 교육했습니다. 이 텍스트는 Reddit에서 공유된 링크에서 추출한 웹사이트인 Wikipedia의 사람이 쓴 유사한(정확하지는 않지만) 텍스트와 이전 OpenAI 텍스트 생성 시스템을 위해 수집된 일련의 “인간 데모”와 짝을 이루었습니다. (OpenAI는 지원 문서그러나 “인터넷에서 AI가 생성한 콘텐츠의 확산을 감안할 때” 일부 AI가 작성한 텍스트를 사람이 작성한 것으로 잘못 분류했을 수 있습니다.)

OpenAI Textual content Classifier는 중요한 텍스트에 대해서만 작동하지 않습니다. 최소 1,000자 또는 약 150~250단어가 필요합니다. 표절을 감지하지 못합니다. 텍스트 생성 AI가 게우다 학습된 텍스트입니다. 그리고 OpenAI는 English-forward 데이터 세트로 인해 어린이가 쓴 텍스트나 영어 이외의 언어로 된 텍스트에서 오류가 발생할 가능성이 더 높다고 말합니다.

탐지기는 주어진 텍스트가 AI로 생성되었는지 여부를 평가할 때 답변을 약간 헤지합니다. 신뢰 수준에 따라 텍스트에 “매우 가능성 없음” AI 생성(확률 10% 미만), “가능성 낮음” AI 생성(10%~45% 가능성), ” AI 생성(45%~90% 확률), “아마도” AI 생성(90%~98% 확률) 또는 “가능성 있는” AI 생성(98% 이상의 확률).

호기심에 분류기를 통해 텍스트를 입력하여 어떻게 관리할 수 있는지 확인했습니다. Meta’s에 대한 TechCrunch 기사의 여러 단락이 지평선 세계 OpenAI 지원 페이지의 스니펫이 AI로 생성되지 않았기 때문에 분류자는 ChatGPT의 기사 길이 텍스트로 더 힘든 시간을 보냈고 결국 완전히 분류하지 못했습니다. 그러나 Gizmodo에서 ChatGPT 출력을 성공적으로 발견했습니다. 조각 약 — 또 뭐? — ChatGPT.

OpenAI에 따르면 분류기는 사람이 쓴 텍스트를 9percent의 시간 동안 AI가 쓴 것으로 잘못 표시합니다. 그 실수는 내 테스트에서 발생하지 않았지만 작은 샘플 크기까지 그것을 초크합니다.

OpenAI 텍스트 분류기

이미지 크레딧: OpenAI

실용적인 수준에서 나는 분류자가 짧은 글을 평가하는 데 특별히 유용하지 않다는 것을 알았습니다. 1,000자는 이메일(적어도 내가 정기적으로 받는 이메일)과 같은 메시지 영역에서 도달하기 어려운 임계값입니다. 그리고 한계는 잠시 멈추게 합니다. OpenAI는 생성된 텍스트에서 일부 단어나 절을 수정하여 분류자를 피할 수 있다고 강조합니다.

분류기가 쓸모없다는 뜻이 아닙니다. 그러나 그것은 현재 상태에서 저지른 사기꾼(또는 그 문제에 대한 학생)을 확실히 막지 못할 것입니다.

문제는 다른 도구가 있습니까? AI 생성 텍스트 감지기에 대한 수요를 충족하기 위해 가내 산업이 생겨났습니다. Princeton College 학생이 개발한 ChatZero는 텍스트가 AI로 작성되었는지 여부를 감지하기 위해 “당황”(텍스트의 복잡성) 및 “폭발성”(문장의 변형)을 포함한 기준을 사용합니다. 표절 탐지기 터니틴 자체 AI 생성 텍스트 감지기를 개발 중입니다. 그 외에도 Google 검색은 AI가 생성한 밀과 인간이 생성한 왕겨를 분리할 수 있다고 주장하는 최소 6개의 다른 앱을 제공하여 은유를 고문합니다.

고양이와 쥐 게임이 될 가능성이 높습니다. 텍스트 생성 AI가 향상됨에 따라 감지기(사이버 범죄자와 보안 연구원 사이의 것과 유사한 끝없는 앞뒤로)도 향상될 것입니다. 그리고 OpenAI가 쓴 것처럼 분류자는 특정 상황에서 도움이 될 수 있지만 텍스트가 AI에서 생성되었는지 여부를 결정하는 데 신뢰할 수 있는 유일한 증거가 될 수는 없습니다.

AI가 생성한 텍스트 포즈 문제를 해결할 수 있는 묘책이 없다는 뜻입니다. 아마 없을 것입니다.

[ad_2]

Source_