오늘 아침 일찍 OpenAI는 ChαtGPTT와 Whisper 간의 인터페이스를 공식적으로 공개했으며 개발자는 이제 API를 통해 최신 텍스트 생성 및 음성-텍스트 기능을 사용할 수 있습니다. OpenAI에 따르면 일련의 시스템 수준 최적화를 통해 작년 12월 이후 ChαtGPT 비용이 90% 감소했으며 이제 OpenAI는 이러한 절감된 비용을 개발자에게 혜택을 주기 위해 사용합니다. 개발자는 이제 API를 통해 Whisper v2 대형 모델을 사용할 수 있으므로 속도와 비용 효율성이 향상됩니다. ChαtGPT 모델은 지속적으로 업그레이드 및 개선될 것이며, 모델을 보다 심층적으로 제어할 수 있는 전용 용량이 제공될 것입니다.
채팅GPT 인터페이스
모델
OpenAI에서 발표한 ChαtGPT 모델의 이름은 gpt-3.5-turbo
ChαtGPT 제품에 사용된 것과 동일한 모델입니다. 가격은 $0.002/1000 토큰으로 이전보다 text-davinci-003
10배 저렴합니다 . gpt-3.5-turbo
채팅 시나리오에서 경험을 표현하고 많은 비채팅 시나리오 애플리케이션도 잘 수행할 수 있으며 개발자는 최소한의 조정으로 모델에서 모델로 text-davinci-003
전환 할 수 있습니다 gpt-3.5-turbo
.
OpenAI는 ChαtGPT 모델을 지속적으로 개선할 예정이므로 gpt-3.5-turbo
모델을 지속적으로 업데이트(4월에 최신 안정 버전으로 업그레이드 예정)하고 OpenAI도 gpt-3.5-turbo
해당 모델을 사용할 것을 권장합니다. 특정 모델 버전에 대한 개발자의 요구를 충족하기 위해 OpenAI는 특정 스냅샷 버전도 제공합니다. 현재 사용 가능한 특정 스냅샷 버전은 gpt-3.5-turbo-0301
향후 3개월 동안 업데이트되지 않으며 2023년 6월 1일까지 유효합니다.
모델명 | 설명하다 | 최대 요청 | 훈련 데이터 |
---|---|---|---|
gpt-3.5-터보 | 가장 강력한 GPT-3.5 모델로, 단 1/10 text-davinci-003 의 . 반복적으로 업데이트 됩니다. |
4,096 토큰 | 2021년 6월 현재 |
gpt-3.5-터보-0301 | gpt-3.5-turbo 2023년 3월 1일 스냅샷 버전 . 이 모델은 향후 3개월 이내에 업데이트되지 않으며 유효 기간은 2023년 6월 1일에 종료됩니다. |
4,096 토큰 | 2019년 10월 현재 |
상호 작용
gpt-3.5-turbo
채팅 장면 디자인 으로 인해 인터페이스 디자인에 약간의 변화가 생겼습니다. GPT-3 인터페이스에서 질문은 prompt
필드를 통해 전달 되며 필드 대신 배열이 gpt-3.5-turbo
없습니다 . 다음은 일반적인 인터페이스 호출 예입니다.prompt
messages
import openai
completion = openai.ChatCompletion.create(
model="gpt-3.5-turbo",
messages=[
{
"role": "system", "content": "你是一个聪明的助理"},
{
"role": "user", "content": "哪支球队赢得了2018世界杯?"},
{
"role": "assistant", "content": "法国国家男子足球队获得2018年俄罗斯世界杯。"},
{
"role": "user", "content": "决赛对手是谁?"}
]
)
print(completion)
messages
위의 샘플 코드에서 여러 라운드의 대화를 배열 로 캡슐화 하고 각 메시지 role
에는 합계가 있습니다 content
. , role
의 선택적 값은 메시지 내용 입니다 .system
user
assistant
content
일반적으로 대화의 형식은 system
먼저 메시지를 보낸 다음 user
메시지와 assistant
메시지를 번갈아 가며 전달하는 것입니다.
system
메시지는 모델의 동작을 설정하는 데 도움이 됩니다. 위의 예에서 모델은 "당신은 똑똑한 조수입니다"라고 말하고 모델은 조수 역할을 하며 출력은 조수처럼 간결하고 명확합니다.
user
메시지는 모델을 안내하는 데 도움이 됩니다. 사용자 질문(일반적으로 마지막 질문)이거나 개발자 지시문 설정 또는 상황별 프롬프트일 수 있습니다.
assistant
메시지는 컨텍스트를 저장하는 데 도움이 됩니다. 모델의 이전 출력이거나 원하는 동작의 예를 제공하기 위해 개발자가 작성할 수 있습니다.
모델은 과거 요청에 대한 기억이 없기 때문에 모든 관련 정보는 대화를 통해 제공되어야 합니다. 따라서 과거 세션을 포함하면 모델이 문제를 더 잘 이해하는 데 도움이 될 수 있습니다. user
위의 예에서 중간 메시지와 소식이 없는 경우 assistant
모델이 혼자 "결승전 상대는 누구입니까?"
gpt-3.5-turbo
반환된 데이터의 형식도 약간 변경되었습니다. GPT-3 인터페이스의 출력은 text
필드로 캡슐화되고, gpt-3.5-turbo
GPT-3 인터페이스의 출력은 필드로 캡슐화되며 역시 와 message
로 구성된다 . 간단히 출력을 얻을 수 있습니다 .role
content
completion['choices'][0]['message']['content']
모범 사례
gpt-3.5-turbo
성능은 와 비슷 하지만 text-davinci-003
가격은 text-davinci-003
1/10이므로 대부분의 사용 사례에 공식적으로 권장됩니다 gpt-3.5-turbo
.
개발자에게는 변경해야 할 부분이 거의 없으며 형식 만 prompt
변경 하면 됩니다.messages
"prompt": "哪支球队赢得了2018世界杯?"
로 변경:
messages: [
{
"role": "system", "content": "你是一个聪明的助理"},
{
"role": "user", "content": "哪支球队赢得了2018世界杯?"}
]
또는 더 간단하게 대신:
messages: [
{
"role": "user", "content": "哪支球队赢得了2018世界杯?"}
]
⚠참고: gpt-3.5-turbo 및 gpt-3.5-turbo-0301은 미세 조정을 지원하지 않습니다.
속삭임 인터페이스
Whisper는 2022년 9월 OpenAI에서 오픈 소스로 공개한 음성-텍스트 모델입니다. 출시 후 개발자 커뮤니티로부터 큰 찬사를 받았습니다. 이제 $0.006/분의 가격으로 API를 통해 Whisper v2 모델을 호출할 수 있습니다. 고도로 최적화된 서비스 스택은 Whisper가 다른 서비스에 비해 더 빠른 성능을 보장합니다.
Whisper API는 인터페이스를transcribe
제공하고 여러 오디오 형식(m4a, mp3, mp4, mpeg, mpga, wav, webm)을 지원합니다.translate
고쳐 쓰다
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper-1", audio_file)
번역하다
import openai
audio_file= open("/path/to/file/audio.mp3", "rb")
transcript = openai.Audio.translate("whisper-1", audio_file)
Whisper는 현재 아프리칸스어, 아랍어, 아르메니아어, 아제르바이잔어, 벨로루시어, 보스니아어, 불가리아어, 카탈루냐어, 중국어, 크로아티아어, 체코어, 덴마크어, 네덜란드어, 영어, 에스토니아어, 핀란드어, 프랑스어, 갈리시아어, 독일어, 그리스어 , 히브리어, 힌디어, 헝가리어, 아이슬란드어를 지원합니다. , 인도네시아어, 이탈리아어, 일본어, 칸나다어, 카자흐어, 한국어, 라트비아어, 리투아니아어, 마케도니아어, 말레이어, 마라티어, 마오리어, 네팔어, 노르웨이어, 페르시아어, 폴란드어, 포르투갈어, 루마니아어, 러시아어, 세르비아어, 슬로바키아어, 슬로베니아어, 스페인어 스와힐리어, 스웨덴어, 타갈로그어 , 타밀어, 태국어, 터키어, 우크라이나어, 우르두어, 베트남어, 웨일스어.
중국어를 지원하십시오! 중국어를 지원하십시오! 중국어를 지원하십시오!