Binibigyan ng OpenAI ang ChatGPT ng Boses para Tumugon sa Mga Prompt at Utos

Binibigyan ng OpenAI ang ChatGPT ng Boses para Tumugon sa Mga Prompt at Utos
Ang mga mambabasang tulad mo ay tumutulong sa pagsuporta sa MUO. Kapag bumili ka gamit ang mga link sa aming site, maaari kaming makakuha ng isang affiliate na komisyon. Magbasa pa.

Ang ChatGPT ay nakatakdang maging isang interactive na generative na karanasan sa AI. Ibinunyag ng OpenAI na ang nangungunang AI chatbot sa mundo ay makakapagsalita at makakasagot sa mga query ng user gamit ang isang synthesized, malamang AI-generated, na boses.





Kasama ng bagong natuklasang boses nito, makakatugon at makakatalakay din ang ChatGPT ng mga partikular na larawang na-upload dito o na-snap habang ginagamit ang ChatGPT Android o iOS app. Ang feature sa pagkilala ng larawan ay katulad ng tunog ng Google Lens at iba pang app na gumagamit ng mga neural network upang tumpak na matukoy ang data at impormasyon.





Binibigyan ng OpenAI ng Boses ang ChatGPT

Noong Setyembre 25, 2023, ChatGPT developer Inihayag ang OpenAI bibigyan nito ng boses ang nangunguna sa mundong generative AI chatbot nito. Ang mga user ng ChatGPT ay maaaring direktang makipag-usap sa chatbot at hilingin itong magsalita pabalik, na epektibong nagbibigay-daan sa ChatGPT na direktang makipag-usap gamit ang boses sa unang pagkakataon.





Ang halimbawang clip ng OpenAI ay nagtatampok ng isang babaeng humihiling sa ChatGPT na lumikha ng isang natatanging kuwento sa oras ng pagtulog, kung saan ang ChatGPT ay nararapat na tumugon sa isang babaeng naka-synthesize na boses.

ilipat ang apps sa sd card android

Ayon kay Naka-wire , ang bagong text-to-speech na modelo ay binuo sa loob ng bahay. Maaari itong bumuo ng 'parang tao' na audio mula sa teksto at ilang segundo ng sample na pananalita ( gamit ang modelo ng OpenAI Whisper ) at magsalita sa iba't ibang tono at istilo. Makakahanap ka ng hanay ng mga sample ng boses sa Ang blog ng OpenAI .



Inilalagay na ng ilang kumpanya ang bagong modelo ng boses ng OpenAI upang magamit. Halimbawa, ginagamit ng Spotify ang text-to-speech model ng OpenAI upang isalin ang mga podcast sa iba't ibang wika, na pinagsasama ang kahusayan sa pagsasalin ng wika ng ChatGPT sa bagong kakayahan nito sa pagsasalita.

Ang bagong text-to-speech na modelo ng ChatGPT ay available lang sa mga subscriber ng Plus at Enterprise gamit ang opisyal na Android at iOS app at inaasahang ilalabas sa loob ng susunod na dalawang linggo (simula sa Setyembre 25, 2023). Higit pa rito, ang bagong feature ng boses ay limitado sa English sa simula, kahit na inaasahan naming mabilis itong magbago.





naka-plug sa pagsingil ngunit hindi nagcha-charge

Makikilala ng ChatGPT at at Mga Larawan

Ang pangalawang bahagi ng pag-update ng ChatGPT ng OpenAI ay ang kakayahang pag-aralan at pag-usapan ang mga larawang na-upload sa tool. Ang opsyon sa pagsusuri ng visual na imahe ay itinampok sa mga video sa pag-update ng GPT-4 ngunit hindi pa masyadong napag-usapan mula noong panahong iyon ( ChatGPT Code Interpreter sa isang tabi ).

Ngayon, ang ChatGPT ay nakakakuha ng functionality na katulad ng Google Lens. Maaari kang mag-upload ng larawan sa ChatGPT o kumuha ng litrato gamit ang iyong smartphone camera sa ChatGPT app, at idedetalye nito ang larawan, magdagdag ng higit pang konteksto kung kinakailangan.





Ang pagtawag dito na 'katulad ng Google Lens' ay talagang isang inhustisya. Ang kakayahang makipag-chat nang pabalik-balik tungkol sa larawan upang makakuha ng higit pang impormasyon at konteksto ay ginagawa itong lubhang kapaki-pakinabang para sa malawak na hanay ng mga setting. Gayunpaman, mahalagang tandaan ang pinong pag-print, kung saan nilinaw ng OpenAI na limitado nito ang 'kakayahang magsuri at gumawa ng mga direktang pahayag tungkol sa mga tao' ng ChatGPT para sa privacy at katumpakan na mga dahilan. Gayunpaman, maaari bang ang isang tool na 'Who Is This' na pinapagana ng OpenAI ay gagana para sa hinaharap? (Sana hindi!)

Tulad ng bagong text-to-speech na modelo, ilalabas ng OpenAI ang pagkilala sa larawan sa susunod na dalawang linggo, bagama't magiging available ito sa lahat ng platform, hindi lang sa ChatGPT app.

Privacy, Seguridad, at Iba Pang Mga Isyu

Malinaw ang mga implikasyon ng ChatGPT na pinapagana ng boses. Sigurado, ito ay kapana-panabik. Gayunpaman, ang kakayahang lumikha ng isang natatanging synthesize na boses gamit lamang ang isang maikling snippet bilang isang halimbawa ay may malaking isyu sa privacy at seguridad. Napakalaki ng potensyal para sa mga malisyosong aktor na pagsamantalahan ang mga tool na ito, at tulad ng anumang generative AI tool, kapag ang genie ay wala na sa bote, talagang hindi na ito babalik. ang tubig.

Kahit na ang babala ng OpenAI sa paksa ay tila lumilipas sa kabila ng pagbanggit sa mga isyu:

Gayunpaman, ang mga kakayahang ito ay nagpapakita rin ng mga bagong panganib, tulad ng potensyal para sa mga malisyosong aktor na magpanggap bilang mga pampublikong pigura o gumawa ng panloloko. Ito ang dahilan kung bakit ginagamit namin ang teknolohiyang ito para paganahin ang isang partikular na kaso ng paggamit—voice chat.

ang firefox ng proxy server ay tumatanggi sa mga koneksyon

Dahil ito ang dulo ng iceberg, asahan ang pagtulak laban sa bagong natuklasang boses ng ChatGPT, lalo na kapag may predictable uptick sa mga hindi magandang headline na nagsasabing ginagamit ang ChatGPT para gumawa ng panloloko at iba pa.

Ginagawa ng OpenAI ang ChatGPT na Go-To AI App

Kung mas maraming OpenAI ang nagdaragdag ng mga feature na madaling gamitin sa ChatGPT, lalo itong nagiging go-to generative AI app. Bilang unang umabot sa malawakang katanyagan sa panahon ng paunang pagbuo ng AI boom, ang ChatGPT ay nangunguna pa rin at ang tanging app na ginagamit ng ilan, sa kabila ng kumpetisyon mula sa mga tulad ng Google Bard (at potensyal na Google Gemini) at Claude ni Anthropic.

Hangga't ang OpenAI ay maaaring magpatuloy sa pagdaragdag ng mga feature na nagpapadali sa ChatGPT na gamitin, ito ay papanatilihin ang mga tao na nakakabit at itulak na palapit sa layunin nito ng isang tunay na multi-modal na AI tool.