Baidu Wenxin Yiyan ha fatto il suo debutto! Non è ancora possibile eguagliare ChatGPT, ma non essere deluso

L’intelligenza artificiale è davvero di gran moda in questi giorni.

OpenAI si affida alla forza di ChatGPT per attirare l’attenzione, e Google lo ha seguito con Bard. Proprio ieri, il modello GPT-4 ha rubato di nuovo le luci della ribalta. Hai appena cantato del campo dell’intelligenza artificiale dove ho fatto il mio debutto, oggi è il turno di Baidu.

Proprio questo pomeriggio, l’attesissimo Baidu Wenxin è arrivato come da programma. Tuttavia, all’inizio della conferenza stampa, il CEO di Baidu, Robin Li, ha dato a tutti una possibilità:

In un certo senso, Baidu si sta preparando a questo (pubblicando Wenxin Yiyan) da molti anni. Abbiamo iniziato a investire nella ricerca sull’IA più di dieci anni fa e abbiamo lanciato il modello di linguaggio grande Wenxin nel 2019. Wenxin Yiyan di oggi è una continuazione degli sforzi degli ultimi molti anni.

Ma non si può dire che siamo completamente pronti. Wenxin ha affermato che la soglia per il benchmarking rispetto a ChatGPT, o anche GPT-4, è molto alta. Nessun grande produttore globale è ancora arrivato e Baidu è il primo. Il mio test rileva che ci sono ancora molte imperfezioni.

Come si è comportato il tardivo Wen Xin Yiyan? Quanto è il divario con ChatGPT? Può soddisfare la domanda del mercato di grandi modelli in lingua cinese? Ne abbiamo fatto un’analisi completa.

Rilasceremo anche il sito Web per i test interni  https://cloud.baidu.com/survey_summit/wenxin.html?track=C816552

Cosa può fare una nuova generazione di modelli linguistici di grandi dimensioni e prodotti di intelligenza artificiale generativa?

Cinque punti chiave:

  • Scrittura creativa;
  • Creazione di copywriting aziendale;
  • Calcoli matematici e logici;
  • Comprensione cinese;
  • Generazione multimodale.

Per questi cinque scenari, Robin Li ha fornito rispettivamente delle dimostrazioni. Vale la pena ricordare che queste dimostrazioni non sono operazioni dal vivo, ma registrazioni.

Il primo è l’abilità di creazione letteraria di Wen Xin Yi Yan, Li Yanhong ha continuamente sollevato diverse questioni relative al “problema dei tre corpi” a Wen Xin Yi Yan.

Prima di tutto, dal video dimostrativo, la velocità di risposta di Wenxinyiyan è molto veloce, molto più veloce di ChatGPT, e il contenuto che ne esce è abbastanza buono. Successivamente, lanceremo le stesse domande a ChatGPT e Bing Chat. Diamo un’occhiata a tre differenza tra il

▲L’animazione non è accelerata

Per quanto riguarda la creazione di copywriting commerciale, Li Yanhong ha posto a Wen Xin una domanda:

Se vuoi creare una società di servizi tecnologici che utilizzi modelli di grandi dimensioni per servire l’aggiornamento digitale delle piccole e medie imprese, quale nome di società puoi scegliere?

Ecco le sue domande e risposte.

Per non parlare, è abbastanza decente.

Può anche essere utilizzato per generare comunicati stampa.Si può dire che l’intelligenza artificiale viene utilizzata dall’inizio alla fine, il che è in linea con il posizionamento di questa azienda.

Nella sessione di deduzione logica matematica, Baidu ha posto una domanda su polli e conigli nella stessa gabbia, Wen Xin ha prima scoperto che la domanda era sbagliata, quindi ha cambiato la domanda ed è stata in grado di rispondere con precisione.

Prima che Wenxin Yiyan fosse rilasciato, alcune persone avevano intuito che questo modello linguistico sarebbe stato migliore di OpenAI, Google e Microsoft, quindi anche Baidu ha mostrato le sue abilità in questa parte. Wenxin Yiyan non solo ha risposto con precisione al significato dell’idioma “Luoyang Zhigui ” , ha anche spiegato il fenomeno finanziario che c’è dietro, e alla fine ha scritto un poema acrostico tibetano usando questo idioma.

Li Yanhong ha anche menzionato sulla scena che il cinese è il vantaggio di Wen Xin Yi Yan e, al contrario, l’analisi dei materiali inglesi è diventata il suo svantaggio.

Infine, viene introdotta l’abilità di generazione multimodale di Wenxin Yiyan: disegnare immagini, scrivere lunghi testi e generare brevi contenuti video basati su testi vengono completati uno per uno, un’abilità che ChatGPT non ha.

▲ Può anche generare voci dialettali

Li Yanhong ha anche affermato che Baijiahao sta già utilizzando le capacità di generazione multimodale di Wenxin Yiyan per convertire i contenuti di testo in video.

Dopo l’incontro, il primo gruppo di utenti può sperimentare prima Wenxin Yiyan attraverso il codice di test interno fornito da Baidu.Abbiamo inviato l’applicazione di test interno e ti forniremo contenuti di esperienza il prima possibile in futuro.

Prima di allora, abbiamo fornito le diverse scene dimostrate durante la riunione rispettivamente a ChatGPT (versione 3.5) e Bing Chat per vedere come vengono visualizzate.

Rispetto a ChatGPT e Bing Chat, com’è l’esperienza di Wenxin Yiyan?

Durante la dimostrazione, Li Yanhong ha ripetutamente sottolineato che Baidu si trova in una posizione unica nell’elaborazione della lingua cinese.

Rispetto a ChatGPT e Bing Chat, la più grande differenza ora è la generazione multimodale, ovvero poster, contenuti vocali e persino video possono essere generati attraverso il linguaggio.

Nella presentazione della conferenza stampa, Li Yanhong ha dimostrato l’uso di Wenxin Yiyan per generare manifesti di eventi, voci dialettali e generare video relativi agli eventi basati sul contenuto delle domande. Tuttavia, il costo della generazione di video è relativamente elevato e non è ancora aperto a tutti gli utenti in questa fase.

La capacità di generare immagini e video ci ha davvero fatto brillare gli occhi. Robin Li ha anche affermato: “L’IA generativa multimodale è una chiara tendenza di sviluppo”.

Oltre a questa funzionalità, siamo anche curiosi di altre funzionalità rispetto a ChatGPT e Bing Chat, quindi abbiamo utilizzato il contenuto dimostrato nella conferenza stampa per chiedere informazioni su ChatGPT (versione 3.5) e Bing Chat. Consentitemi di parlare prima della conclusione: le prestazioni di Wenxinyiyan in campo cinese sono davvero migliori rispetto ai due predecessori ChatGPT e Bing Chat.

La prima è la domanda sul “problema dei tre corpi”: sia Bing Chat che Wenxin Yiyan possono rispondere correttamente alla domanda su chi sia l’autore e da dove venga, mentre ChatGPT ha etichettato erroneamente la città natale di Liu Cixin come Shandong.

È interessante notare che la fonte di informazioni per Bing Chat è Baidu Baike.

Per quanto riguarda gli attori della serie TV “Three-Body Problem” che andrà in scena all’inizio del 2023, ChatGPT, la cui base informativa è bloccata nel 2021, si sgonfia nuovamente, affermando che la serie TV “Three-Body Problem” non ha ancora ha iniziato le riprese, mentre Bing Chat ha trovato la risposta in Douban.

In termini di copywriting aziendale, tutti e tre possono esprimere la propria opinione e ChatGPT ha anche allegato premurosamente un nome inglese, che è conveniente per noi per entrare nel mercato internazionale.

Tuttavia, Bing Chat ha identificato erroneamente il significato della domanda alla prima richiesta e non mi ha fornito il nome esatto della società, ma ha fornito una soluzione su come scegliere il nome di una società.

Per quanto riguarda quale dei tre nomi sia migliore, lascio giudicare a tutti.

Che si tratti di ChatGPT o Bing Chat, non ci danno la massima tranquillità quando facciamo problemi di matematica, ma il problema del pollo e del coniglio nella stessa gabbia menzionato nella conferenza stampa di Baidu non li ha infastiditi, ed entrambi hanno risposto con precisione.

Al contrario, preferisco l’interpretazione di Bing Chat, che è più simile a un insegnante persuasivo, e la risposta di Wen Xinyiyan è un po’ come una risposta di riferimento dopo la lezione.

In termini di comprensione cinese, si riflettono i vantaggi di Wenxinyiyan.

Quando ho chiesto “Quanto costava il giornale a Luoyang in quel momento”, ChatGPT ha erroneamente pensato che stessi chiedendo il prezzo della dinastia Tang e mi ha detto che il giornale a Luoyang non era affatto costoso. L’identificazione di Bing Chat, ma non ha fornito dati precisi.

E il prezzo di Wenxin da due a tremila Wen è almeno coerente con i dati che ho ottenuto dalla ricerca.

Credo che tu abbia anche notato che, per non parlare del contenuto della scrittura, né ChatGPT né Bing Chat capiscono cosa siano gli acrostici tibetani.In confronto, la performance di Baidu Wenxin Yiyan è davvero eccezionale.

Naturalmente, un simile confronto è ingiusto nei confronti di ChatGPT e Bing Chat. Dopotutto, non abbiamo ufficialmente sperimentato Wenxinyiyan, ed è solo un confronto con la presentazione alla conferenza stampa. Dopo aver avuto l’opportunità di provare, sperimenteremo Wenxinyiyan per la prima volta e vedremo come ci comportiamo in quel momento.

Li Yanhong ha anche menzionato nella conferenza stampa che sebbene la lingua cinese abbia evidenti vantaggi, Wenxinyiyan non si è allenato abbastanza per le lingue inglesi e gli scenari di codice e le sue prestazioni non sono abbastanza buone.Credo che Baidu migliorerà rapidamente in futuro.

Tieni i piedi per terra e guarda le stelle

Non c’è dubbio che l’uscita di Wenxin Yiyan sia un evento fondamentale per l’Internet cinese.

Come ha affermato Li Yanhong all’inizio, Baidu è il primo grande produttore a produrre un prodotto che può essere paragonato a ChatGPT e ha realizzato da zero una svolta nel prodotto generativo AI di grandi dimensioni in lingua cinese.

Ma d’altra parte, dobbiamo anche esaminare correttamente il divario tra Wenxinyiyan e ChatGPT.

Ciò che oggi chiamiamo ChatGPT, o il modello linguistico GPT-4 dietro di esso, ha impiegato 5 anni e 4 iterazioni per completare il processo dal cambiamento quantitativo al cambiamento qualitativo. È quasi impossibile per Wen Xinyiyan recuperare il ritardo in così poco tempo.

A giudicare dalla conferenza stampa di oggi, Wenxinyiyan non è un prodotto rivoluzionario come ci si aspettava, ma piuttosto un test a medio termine delle riserve tecnologiche di intelligenza artificiale di Baidu, dimostrando che Baidu ha anche la capacità di perseguire la ricerca e lo sviluppo dei prodotti di intelligenza artificiale più avanzati .

Dopo l’apertura al pubblico, Wenxinyiyan può apprendere e migliorare attraverso un gran numero di richieste di ricerca da parte degli utenti, in modo da migliorare l’accuratezza e la velocità nell’affrontare i problemi corrispondenti. Su ChatGPT, abbiamo visto la velocità con cui si evolvono i modelli di linguaggio AI.

Se anche tu non vedi l’ora di vedere una vera “versione cinese di ChatGPT”, potresti anche concedere a Wen Xin un po’ di tempo e pazienza. A tre giorni dall’addio, dovremmo guardarci con ammirazione, soprattutto per i modelli AI.

 

Taglia la merda.

#Benvenuti a prestare attenzione all’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), altri contenuti interessanti ti verranno presentati il ​​prima possibile.

Ai Faner | Link originale · Visualizza i commenti · Sina Weibo