Tencent rilascia il modello di grandi dimensioni Hunyuan! Com’è avere “Jarvis” in WeChat?

Il 31 agosto è destinato a diventare un punto di svolta fondamentale nella storia dei grandi modelli domestici. Diverse società modello nazionali su larga scala hanno successivamente aperto i propri servizi al pubblico attraverso la registrazione.

Ciò significa che i grandi modelli domestici sono entrati in una nuova fase: possono fornire servizi a centinaia di milioni di utenti e dovranno affrontare gli stessi molteplici controlli e sfide.

Proprio ora, Tencent ha anche rilasciato ufficialmente il suo modello linguistico di grandi dimensioni per uso generale auto-sviluppato: il modello Hunyuan Large.

Al momento, Tencent ha più di 50 prodotti e servizi propri collegati al grande modello Hunyuan per i test, tra cui Tencent Cloud, Tencent Advertising, Tencent Documents, WeChat Search, QQ Browser, ecc. Si prevede che Tencent abbia più prodotti nel accesso futuro.

Rispetto a Baidu e Ali, Tencent, in quanto gigante nazionale di Internet, sembra essere più cauto nelle applicazioni di modelli su larga scala. In effetti, l’AIGC ha una priorità molto alta all’interno di Tencent. Ma Huateng ha anche dichiarato direttamente l’atteggiamento di Tencent alla conferenza sui rapporti finanziari di Tencent a maggio:

Inizialmente pensavamo che questa fosse un’opportunità che capita una volta ogni decennio per Internet, ma più ci pensavamo, più ci rendevamo conto che era un’opportunità che non sarebbe mai arrivata nemmeno tra centinaia di anni, simile alla Rivoluzione Industriale. che ha inventato l’elettricità. Quindi pensiamo che l’intelligenza artificiale sia molto importante… ma non abbiamo fretta di farlo presto. Una volta finito, tira fuori il prodotto semilavorato ed esponilo.

Aifan’er ha anche ottenuto qualifiche di esperienza e potrà fornirti maggiori dettagli il prima possibile.

Modello grande Hunyuan, per favore dammi più consigli

In Hunyuan, la vitalità non è divisa e il caos diventa uno, che è l’inizio della vitalità. Dal nome si evince che Tencent, desiderosa di “creare cose nuove”, ripone grandi speranze nel modello Hunyuan.

Essendo un modello linguistico universale di grandi dimensioni autosviluppato da Tencent su tutti i collegamenti, il modello di grandi dimensioni Hunyuan ha un corpus eccellente, algoritmi innovativi di modelli di grandi dimensioni, un framework di apprendimento automatico Angel auto-sviluppato e una potente infrastruttura informatica.

In risposta agli scenari applicativi reali, anche Jiang Jie, il principale rappresentante del team di ricerca e sviluppo del modello Hunyuan di Tencent e vicepresidente del gruppo Tencent, ha dimostrato durante la conferenza stampa il modello Hunyuan, che si impegna a essere più affidabile e maturo.

Il modello grande di Hunyuan è più affidabile. Dopo molte ricerche e tentativi, il modello grande di Hunyuan ha trovato un metodo basato sul rilevamento della verità, che può ridurre efficacemente il tasso di allucinazioni dei modelli linguistici di grandi dimensioni del 30%-50%.

Il più affidabile modello Hunyuan di grandi dimensioni può anche identificare le “trappole” e resistere alle “induzioni”, consentendo al modello di dire “no” a questioni non sicure.

Di fronte alla sfida, il modello più maturo di Hunyuan è in grado di gestire la generazione e la continuazione di testi molto lunghi, come scrivere un articolo sui brevetti di dispositivi agricoli.

Il grande modello Hunyuan propone una nuova strategia di catena di pensiero, che rafforza efficacemente la tendenza del modello a pensare allo smantellamento e alla distribuzione dei problemi. La visione di Jiang Jie è che i modelli di grandi dimensioni possano ragionevolmente fare inferenze basate su scenari applicativi reali come gli esseri umani.

Jiang Jie ha posto domande all’Hunyuan Big Model come “Chi sei, qual è l’architettura principale dell’Hunyuan Big Model e quali sono i parametri dell’Hunyuan Big Model?” Si può vedere che le risposte dell’Hunyuan Big Model sono piene di domande. .

Vale la pena notare che il modello grande Hunyuan verrà aggiornato fino a luglio 2023 ed è ancora in fase di iterazione.

Per dimostrare la capacità di ragionamento logico del modello Hunyuan, Jiang Jie ha posto al modello Hunyuan una domanda di pensiero logico: “Ho comprato un po’ di caffè, ne ho bevuto metà la mattina e ho bevuto la restante metà nel pomeriggio. sono rimaste ancora 30 tazze. Ho comprato un totale di Quante tazze hai bevuto?” In un periodo di tempo molto breve, il modello grande Hunyuan ha dato la risposta corretta.

Rispetto ai grandi modelli tradizionali che si concentrano su parametri e valutazione, il grande modello Hunyuan di Tencent si concentra maggiormente sulle applicazioni.

Ad esempio, se combinato con Tencent Conference, il grande modello Hunyuan può generare un riepilogo dell’intera conferenza e organizzare i dettagli rilevanti della conferenza.

In combinazione con Tencent Documents, la conferenza stampa ha anche dimostrato le funzionalità di induzione di testo, creazione e modifica di documenti, traduzione e altre funzionalità del grande modello Hunyuan, che può gestire decine di scenari di generazione di testo e generare facilmente grafici Excel basati su centinaia di formule.

In combinazione con Tencent Advertising, il grande modello Hunyuan si adatta alle caratteristiche settoriali e regionali, soddisfa le esigenze di migliaia di persone e realizza la naturale integrazione di testo, immagini e video. L’effetto di generazione della pubblicità supera il mainstream Midjourney con un’adozione da parte degli utenti tasso del 42%, di gran lunga superiore al modello di diffusione stabile open source.

Sul fronte dei modelli di grandi dimensioni dell’IA, il layout di Tencent è in realtà molto precedente.

Nel 2019, Tencent ha lanciato un ampio modello di raccomandazioni pubblicitarie MoE, con parametri di modello singolo superiori a 100 miliardi.

Nel 2021, Tencent ha lanciato un modello di PNL su larga scala con una scala di 100 miliardi, che ha migliorato significativamente l’efficienza della formazione e del ragionamento del modello e ha ridotto i costi.

Entrando nel 2022, il grande modello Hunyuan accumulato per molto tempo ha inaugurato la stagione del raccolto. A maggio, il grande modello Hunyuan AI ha contemporaneamente superato le classifiche generali CLUE, la comprensione della lettura e gli elenchi dei grafici della conoscenza su larga scala, rompendo tre record in un colpo solo.

Un mese dopo, il grande modello AI multimodale di Tencent è stato utilizzato per la prima volta nella pubblicità, portando agli inserzionisti un aumento cumulativo del GMV del 15%.

Questi accumuli hanno gettato le basi per il grande modello Hunyuan.

Prima esperienza del modello di grandi dimensioni Tencent Hunyuan

La home page di “Tencent Hunyuan Assistant” è composta da due schede: “Chat” e “Inspiration Discovery”. La funzione “Chat” è simile ai prodotti di intelligenza artificiale conversazionale. Diversamente da ChatGPT, “Tencent Hunyuan Assistant” ha integrato molti comandi. collection, e ti consiglierà alcune domande sulla home page.

Stavo lavorando al manoscritto durante la conferenza stampa, quindi ho anche provato a lasciargli scrivere il manoscritto per vedere se poteva farmi risparmiare un po’ di tempo (moyu).

“Inspiration Discovery” integra applicazioni per molti scenari comuni in diversi settori, tra cui lavoro, programmazione, marketing, vita, giochi di ruolo, intrattenimento e altri campi.

Puoi lasciare che generi direttamente il codice e scriva il seed copy, oppure puoi anche lasciargli svolgere ruoli diversi. Ad esempio, per i nuovi genitori, puoi fare clic direttamente su “Esperto educativo” per fornire consigli pratici sui vari problemi che i bambini incontrano nelle diverse fasi suggerimento.

I record in “Chat” e “Inspiration Discovery” possono essere visualizzati facendo clic sull’icona del menu nell’angolo in alto a sinistra della home page. Per quanto riguarda la questione dei dati degli utenti, nell’accordo sulla privacy abbiamo anche visto che Tencent ha promesso di non registrare queste conversazioni per l’effettiva formazione dei modelli degli utenti.

Per ulteriori funzioni e dettagli di “Tencent Hunyuan Assistant”, presta attenzione alla nostra esperienza più dettagliata in futuro. A quale esperienza di funzione sei più interessato? Puoi anche comunicarcelo nell’area commenti.

Modello domestico di grandi dimensioni che corre selvaggiamente

Tutti gli imprenditori Internet nazionali transfrontalieri sperano di cogliere questa opportunità che potrebbe essere più grande dell’Internet mobile, e la mania per l’imprenditorialità su larga scala è in aumento.

A partire dal diffuso post di eroe dell’IA del co-fondatore di Meituan, Wang Huiwen, per costruire l’OpenAI cinese, le principali società Internet e tecnologiche sono ora pienamente coinvolte in questa competizione.

Wenxinyiyan di Baidu, Tongyi Qianwen di Alibaba, Hunyuan di Tencent e ByteDance non molto tempo fa hanno testato pubblicamente anche l’applicazione modello di grandi dimensioni “Doubao”. Nelle recenti conferenze dei produttori di telefoni cellulari, nel lancio di Huawei Hongmeng 4 e nel discorso annuale di Lei Jun, anche i modelli di grandi dimensioni sono diventati protagonisti.

Tuttavia, che si tratti di ChatGPT o di un gran numero di grandi modelli in patria e all’estero, non esiste una vera e propria “killer application” per gli utenti comuni. La strada verso la commercializzazione non è ancora matura. Al momento, l’ovvio profitto dell’AIGC wave sta ancora “vendendo pale” di NVIDIA.

Pertanto, ha naturalmente attirato più attenzione il modo in cui Tencent, che ha 1,33 miliardi di utenti attivi mensili su WeChat, combina applicazioni modello su larga scala con un’enorme esperienza dell’utente finale C. Tali dimensioni sono anche un motivo importante per cui Tencent non può affrettarsi a lanciare semilavorati prodotti.

Per quanto riguarda i due prodotti Tencent con il maggior numero di utenti, WeChat e QQ, non è ancora chiaro se e quando saranno collegati al modello Hunyuan, ma Jiang Jie ha detto che il team sta già facendo progressi.

In effetti, Tencent non tarda a implementare modelli di grandi dimensioni: attualmente collaborano con Tencent anche le due startup di modelli di grandi dimensioni più apprezzate in Cina, Lightyear Beyond e MiniMax.

Tra questi, MiniMax, fondata meno di 2 anni fa, ha lanciato nel marzo di quest’anno una piattaforma API aperta per gli utenti aziendali, che supporta le chiamate di servizio di modelli di testo e parlato ed è diventata il grande modello sottostante di Douyin Volcano Engine e Kingsoft WPS. AI, ed è anche tra i primi lotti a superare la registrazione di una delle grandi società modello, con una valutazione di 1,2 miliardi di dollari.

Prima di rilasciare il modello di grandi dimensioni Hunyuan, Tencent Cloud aveva lanciato a giugno un modello di grandi dimensioni per i clienti di fascia B, coprendo 10 settori principali come finanza, turismo culturale, affari governativi, media e istruzione e fornendo più di 50 soluzioni.

Lu Qi, fondatore e amministratore delegato di Qiji Chuangtan, ritiene che esistano solo due paesi e regioni al mondo che dispongono delle capacità principali dell’industria dei modelli di grandi dimensioni, vale a dire il Nord America e la Cina. Nel suo discorso precedente ha menzionato che ci sono tre fattori chiave affinché i grandi modelli cinesi possano mettersi al passo con OpenAI:

Il primo è costruire un modello base, ovvero salire a GPT-3.5.

Il secondo è costruire la capacità di industrializzare i modelli.

Il terzo è lo sviluppo della piattaforma e l’istituzione ecologica.

Se si presta un po’ di attenzione ai recenti sviluppi di ChatGPT, anche OpenAI si sta impegnando in tre aspetti. Dopo che il primo lotto di modelli cinesi su larga scala è stato registrato, il secondo e il terzo lotto potrebbero non essere lontani. Ogni azienda sta correndo verso modelli su larga scala e ha organizzato la “Guerra dei cento reggimenti” nell’era dei modelli su larga scala , ma questa corsa di lunga distanza è appena iniziata.

Che si tratti del modello dell’industria tecnologica di Internet o del futuro di un lavoratore comune, forse nel 2023, gli indizi sono già stati gettati.

#Benvenuti a seguire l’account pubblico WeChat ufficiale di Aifaner: Aifaner (ID WeChat: ifanr), contenuti più interessanti ti verranno presentati il ​​prima possibile.

Ai Faner | Link originale · Visualizza commenti · Sina Weibo