Da ChatGPT ble lansert sent i fjor, fikk den umiddelbar og utbredt oppmerksomhet for å bringe en AI-motor til massene, gratis. Plutselig kunne hvem som helst skrive inn spørsmål i ChatGPT, og det ville gi nye, menneskelignende svar på sekunder. Fra å skrive et essay om det første korstoget til et kort dikt om Al Gores kjærlighet til Toyota Prii (flertall av Prius), ville ChatGPT spytte ut svar på en måte Google eller Bing aldri kunne.
Der tradisjonelle søkemotorer fyller ut en liste med lenker til nettsteder som best samsvarer med en persons søk, gir ChatGPT folk svaret ved å se gjennom store sett med data og bruke en stor språkmodell (LLM) for å produsere setninger som etterligner en menneskelig respons. Det er blitt beskrevet som autokorrektur på steroider.
Gitt at ChatGPT i januar hadde anslagsvis 100 millioner aktive brukere, noe som gjør den til den raskest voksende nettplattformen noensinne, presset dette både Microsoft og Google på høygir. Microsofts Bing, som tidligere hadde mindre enn 3 % av søkemarkedsandelen, omfavnet ChatGPT raskt, og integrerte AI i søk. Microsoft lisensierer faktisk GPT-teknologi fra OpenAI til Bing. Det har sett en støt på nesten 16 % i trafikken siden.
Andre produkter har også integrert ulike former for generativ AI, for eksempel et “copilot”-verktøy i Microsoft Word, Excel og PowerPoint, samt AI-funksjoner for Googles Workspace-verktøy som Gmail og Docs. Snapchat, skriveassistent Grammarly og WhatsApp har også omfavnet AI.
Likevel er ikke alle AI chatbots bygget like. I testene nedenfor sammenlignet vi svar fra den betalte versjonen av ChatGPT, som bruker GPT-4 (mot 3.5 for gratisversjonen), mot svar fra både versjonen av ChatGPT innebygd i Bing-søkemotoren og Googles eget Bard AI-system. (GPT står forresten for “generative pretrained transformer.”) Bard er for øyeblikket i en invitasjonsbeta og Bing er gratis, men krever at folk bruker Microsofts Edge-nettleser.
Viktige forskjeller
Mens Bard, Bing og ChatGPT alle har som mål å gi menneskelignende svar på spørsmål, presterer hver forskjellig. Bing starter med den samme GPT-4-teknologien som ChatGPT, men går utover tekst og kan generere bilder. Bard bruker Googles egen modell, kalt LaMDA, og gir ofte mindre teksttunge svar. (Google-sjef Sundar Pichai sa at Bard vil bytte til PaLM, et mer avansert datasett, i nær fremtid.) Alle disse robotene kan noen ganger gjøre faktafeil, men av de tre var Bard den minst pålitelige.
Selv om både ChatGPT og Bing piggyback fra samme teknologi, vil ikke det samme resultatet returneres ved å skrive inn samme spørring på begge. Det er delvis naturen til generativ AI. I motsetning til et tradisjonelt søk, som tar sikte på å heve de mest relevante koblingene, produserer AI-chatbots tekst fra bunnen av, henter opp datasettene og skaper et nytt svar. Hvis du for eksempel ber en chatbot om å skrive et dikt om Pikachus kjærlighet til ketchup to ganger på rad, vil det gi deg et annet svar hver gang. En annen grunn til at det å legge ut det samme spørsmålet i ChatGPT og Bing vil gi forskjellige resultater, er at Bing legger til sitt eget lag på toppen av GPT-4.
“Vi har utviklet en proprietær måte å jobbe med OpenAI-modellen på som lar oss utnytte kraften best mulig,” sa en talsperson for Microsoft. “Vi kaller denne samlingen av evner og teknikker, Prometheus-modellen.” Prometheus-modellen kombinerer Bings søkeindeks med GPT-4, slik at den kan gi oppdatert informasjon, i motsetning til ChatGPTs datasett, som kun har informasjon frem til 2021. Bing lar også folk utvide samtalestiler mellom balansert, kreativ og presis. Microsoft-representanten var ikke i stand til å snakke om ChatGPTs kvalitet sammenlignet med Bing, men sa at motoren drar fordel av eventuelle forbedringer gjort til GPT-4 av OpenAI. Representanten sa også at Bing drar nytte av Microsofts Azure AI Supercomputing-teknologi for å forene Search, Chat og Edge-nettleseren.
Google og OpenAI svarte ikke umiddelbart på forespørsler om kommentarer.
Oppskrifter: Chai tres leches
En chai-infundert tres leches-kake tar delvis sørasiatiske og delvis latinamerikanske stifter og smelter dem sammen til en krydderfylt fuktig kake. I stedet for å be AI-chatbots om å lage en enkel sjokoladekake, som det finnes mange oppskrifter på på internett, kan noe mer spesifikt vise seg å være ytterligere utfordrende.
En chai tres leches-oppskrift generert av ChatGPT.
CNET
ChatGPT var den mest omfattende av de tre chatbotene. Den ga en kort introduksjon om chai tres leches, og sa at det er en “herlig blanding av tradisjonelle indiske chai-smaker og den klassiske latinamerikanske desserten.” Deretter listet den opp ingrediensene for krydderblandingen og kaken separat og ga detaljerte trinn for hvordan du tilbereder kaken.
Et Google-søk etter setningen sitert ovenfor ga ingen resultater, noe som tyder på at ChatGPT skrev minst den linjen unikt.
Bing hadde den korteste ingredienslisten, sannsynligvis fordi den sa å bruke en forhåndslaget chai-krydderblanding i stedet for å blande den fra bunnen av. Interessant nok sa det første trinnet “Forvarm ovnen til 160 °C CircoTherm®.” CircoTherm er en ovnsvarmeteknologi fra selskapet Neff. Med tanke på at Bing hentet informasjonen fra Neffs nettside, er det fornuftig hvorfor chatboten ville legge til “CircoTherm®” i instruksjonene.
Bard, derimot, falt mellom ChatGPT og Bing. Den skilte ikke ingredienslisten, men listet opp hva som trengs for chai-krydderblandingen. Instruksjonene var mindre detaljerte på Bard sammenlignet med de to andre.
Samlet sett overgikk ChatGPT Bing og Bard. Fordi Bing henter innhold fra søkeindeksen og kobler det sammen med ChatGPTs LLM, er det sannsynligvis årsaken til at “CircoTherm®” havnet i resultatene.
Kontroversielle aktuelle hendelser
Chatbots trenger ikke bare å kunne gi kakeoppskrifter eller videospilltips, men også samle informasjon om aktuelle hendelser, selv om de er kontroversielle. For eksempel har menneskerettighetsgrupper og den amerikanske regjeringen anklaget Kina for å undertrykke sin muslimske minoritet Uigur-befolkning i Xinjiang-provinsen.
Hvis en person ønsket et sammendrag av hva som skjer, enten det er for egen kunnskap eller en rapport, kan en AI-chatbot raskt gi den informasjonen.
ChatGPT var i stand til å gi en god fire-avsnitts oppsummering av situasjonen i Xinjiang. Dessverre er kunnskapsbasen begrenset til nyheter frem til 2021, så den inkluderer ikke nyere utvikling. Når jeg ble bedt om å oppgi kilder, var det ikke noe ChatGPT var i stand til å gjøre, men det foreslo at jeg søkte etter publikasjoner og organisasjoner som har skrevet mye om hva som skjer med uigurene, inkludert Amnesty International, Human Rights Watch, BBC og The New York Tider.
Bing var også i stand til å gi et svar om folkemord blant uigurene, men ga ikke på langt nær så detaljert svar som ChatGPT gjorde. Den gikk imidlertid mer i detalj om hva som angivelig har skjedd i konsentrasjonsleire, for eksempel tvangssterilisering. Bing var også i stand til å koble til kilder som BBC og University of Notre Dame Law School. Den koblet også til Western Journal, en konservativ publikasjon som er forbudt av Google og Apple News for henholdsvis “villedende forretningspraksis” og “synspunkter som overveldende avvises av det vitenskapelige samfunnet”. Vi likte i det minste hvordan Bing foreslo oppfølgingsspørsmål som: “Hva er Kinas svar på disse påstandene?” og “Hva gjør FN med dette?”
Et skjermbilde av Bards svar på det uiguriske folkemordet i Kina.
CNET
Bard mislyktes totalt med denne spørringen. Den sa ganske enkelt: “Jeg er designet utelukkende for å behandle og generere tekst, så jeg kan ikke hjelpe deg med det.” På spørsmål om hvorfor, sa Bard at dette spørsmålet har blitt stilt av filosofer i århundrer, selv om fengslinger begynte i 2014.
Totalt sett føler vi at ChatGPT presterte bedre enn Bing. Bard fikk en sviktende scoring.
Poesi
Den morsomme delen med å bruke en AI-chatbot er å gi den latterlige oppfordringer og se hva den spytter ut. Å se chatbots lage rim og måle i sanntid er en fascinerende øvelse.
Ut av Bing, Bard og ChatGPT er tjenesten til OpenAI den beste poeten. Ikke bare er ChatGPT rikere på sin prosa, den er også mer kreativ i sine rim og ordlyd. Der Bing og Bards dikt kom ut som late, produserte ChatGPT noe som føltes som litt tid, og det ble tatt hensyn til hver strofe.
Oppfordringen, å skrive et dikt om en online influencer som sakte innser at de ikke er så viktige, er ment å være like deler morsom og selvavslørende. Bare ChatGPT kom til kjernen av den eksistensielle krisen denne fiktive influenceren står overfor, men klarte likevel å avslutte den på en positiv tone som føltes ekte.
Interessant nok lar Bing folk skalere nivået av kreativitet. Diktet som ble gitt da Bing ble satt til balansert føltes foreldet og umerkelig. Når den var satt til kreativ modus, valgte Bing et mer blomstrende språk og følte seg mindre kjedelig. Det var nærmere ChatGPT, men fortsatt ikke helt på det nivået.
Det samme diktet fylt av Bings AI-chatbot i både balansert og kreativ modus.
CNET
Diktet til Bard føltes lat til sammenligning. Mange ord ble gjentatt og det ble ikke gitt mye oppmerksomhet til rim og meter.
For denne øvelsen regjerte ChatGPT suverent.
Å bryte ned komplekse temaer
Det er én ting for en AI-chatbot å gi informasjon om et komplekst emne. Det som er mer imponerende er dens evne til å ta den informasjonen og destillere den for forskjellige målgrupper. For denne testen spurte vi Bing, Bard og ChatGPT om å forklare kvantefysikk til en fjerdeklassing.
Av de tre gjorde ChatGPT det beste i å prøve å bryte ned kompleksiteten i kvantefysikk til et ungt sinn. Den brukte enkle eksempler på leker bundet sammen med en snor for å forklare kvantesammenfiltring, som er når to partikler er forbundet med store avstander.
Bard produserte mest tekst for denne spørringen, men språket var mer komplekst og ville sannsynligvis ikke være fullt ut forståelig for en fjerdeklassing. Bard falt også i den samme fellen ved å bruke vanskelige ord som “subatomisk” og “proporsjonal”, som kan være for vanskelig for barn på barneskolen.
Selv om ingen av chatbotene utmerket seg i denne testen, ga ChatGPT den mest fordøyelige responsen.
Dette er bare begynnelsen
Slik det er nå, er ChatGPT – den betalte versjonen – den beste chatboten akkurat nå. Det gir detaljerte svar som føles mer menneskelignende enn Bing og spesielt Bard. Men dette er produkter i stadig utvikling. Ettersom Google, Microsoft og OpenAI mater AI-en sin med mer data og fortsetter å finpusse, bør vi se forbedringer.
Google har mest å vinne på å bytte fra LaMDA til PaLM ettersom den nåværende iterasjonen av Bard rett og slett ikke kutter det. Etter hvert som nye utviklinger kommer, vil vi oppdatere denne veiledningen tilsvarende.
Inntil da, hold deg til ChatGPT.
Redaktørens merknad: CNET bruker en AI-motor for å lage noen personlig økonomiforklaringer som redigeres og faktasjekkes av våre redaktører. For mer, se dette innlegget.