Paano Gamitin ang Chatbot Arena para Paghambingin ang Pinakamahuhusay na LLM

Paano Gamitin ang Chatbot Arena para Paghambingin ang Pinakamahuhusay na LLM
Ang mga mambabasang tulad mo ay tumutulong sa pagsuporta sa MUO. Kapag bumili ka gamit ang mga link sa aming site, maaari kaming makakuha ng isang affiliate na komisyon. Magbasa pa.

Sa ilang mga chatbot na magagamit online, maaari itong maging lubhang mahirap na piliin ang isa na nakakatugon sa iyong mga pangangailangan. Bagama't maaari mong ihambing ang alinmang dalawang chatbots nang manu-mano, kakailanganin ito ng malaking oras at pagsisikap.





MUO Video ng araw MAG-SCROLL PARA MAGPATULOY SA NILALAMAN

Ang isang mas mahusay at mas simpleng paraan ay ang paggamit ng Chatbot Arena upang ihambing ang iba't ibang LLM na nagpapagana sa mga sikat na chatbot. Nag-aalok ito ng ilang mga mode para sa paghahambing ng iba't ibang mga modelo, na ipinapaliwanag namin sa ibaba.





Ano ang Chatbot Arena?

Nilikha ng LMSYS Org, ang Chatbot Arena ay isang platform upang i-benchmark ang iba't ibang LLM. Ginagamit nito ang Elo Rating system para i-rank ang iba't ibang modelo.





paano ko tanggalin ang google paghahanap history

Nag-aalok ang Chatbot Arena ng ilang paraan para sa mga user na maghambing at mag-rate ng mga LLM. Batay sa isinumiteng feedback, niraranggo ng Chatbot Arena ang iba't ibang LLM sa pampublikong leaderboard. Ang proyekto ay itinataguyod ng HuggingFace, isang open-source na alternatibo sa ChatGPT .

hindi ko natanggap ang aking package amazon

Paano Ihambing ang Mga Anonymous na LLM sa Chatbot Arena

  screenshot ng labanan sa chatbot arena

Hinahayaan ka ng battle mode ng Chatbot Arena na ihambing ang mga LLM nang hindi nagpapakilala. Halimbawa, maaari mo ihambing ang ChatGPT (GPT 3.5) at Claude . Nangangahulugan ito na ang Chatbot Arena mismo ay pumipili ng alinmang dalawang modelo ng wika at, nang hindi inilalantad ang kanilang mga pangalan, hinahayaan kang ihambing ang mga ito.



Habang pinapasok mo ang unang prompt, kumukuha ang Chatbot Arena ng mga tugon mula sa parehong mga modelo, na ipinapakita ang mga ito nang magkatabi. Binibigyang-daan ka ng platform na muling buuin ang mga tugon (para sa parehong LLM) at i-clear ang kasaysayan upang magsimula ng ibang pag-uusap. Maaari kang patuloy na magtanong hanggang sa makapili ka ng malinaw na panalo.

Pagkatapos, maaari mong piliin kung ang modelong A ay mas mahusay o B. Sa pagpili ng nanalo, ipinapakita ng Chatbot Arena ang mga pangalan ng parehong mga bot. Ang mode na ito ay mahusay na gumagana dahil ang iyong desisyon ay hindi apektado ng iyong dating persepsyon o kasikatan ng mga modelo. Hinahayaan ka rin ng Chatbot Arena na ayusin ang mga parameter tulad ng temperatura, Top P, at max na mga token ng output.





kung paano baguhin ang lokasyon ng app store

Paano Ihambing ang Mga Napiling LLM sa Chatbot Arena

  chatbot arena magkatabi na screenshot

Kung gusto mong paghambingin ang alinmang dalawang partikular na LLM, maaari kang lumipat sa side-by-side mode ng Chatbot Arena. Maliban sa katotohanan na maaari mong piliin ang mga LLM sa iyong sarili, gumagana ang mode na ito halos kapareho ng battle mode. Maaari mong ayusin ang mga parameter, muling buuin ang mga tugon, i-clear ang kasaysayan, at pumili ng panalo sa huli.

Gayunpaman, limitado ang bilang ng mga LLM na available sa mode na ito. Maaari kang pumili ng iba't ibang bersyon ng Llama 2, Vicuna, at ChatGLM. Kahit na ang mga sikat na LLM, tulad ng GPT-4, GPT-3.5, Claude 1, Claude 2, atbp., ay kasalukuyang hindi available sa mode na ito, pinaplano ng Chatbot Arena na idagdag ang mga ito.





Ihambing ang mga LLM Gamit ang Chatbot Arena

Naghahanap ka man ng angkop na chatbot para sa iyong mga pangangailangan o gusto mo lang subukan ang iba't ibang LLM, ang Chatbot Arena ay isang mahusay na platform.

Nagbibigay ito ng pinasimpleng paraan ng paghahambing ng magkakaibang modelo ng wika nang magkatabi. At dahil nagpapanatili ito ng leaderboard batay sa feedback ng mga user, maaari mong direktang tingnan ang mga ranggo ng iba't ibang modelo nang hindi ikaw mismo ang nagpapatakbo ng mga pagsubok.