Il grande modello di Siri di Apple potrebbe non essere quello che pensi

L’intelligenza artificiale di Apple è in ritardo ma arriva.

Secondo il Wall Street Journal, Apple starebbe discutendo con Baidu sull’integrazione dell’intelligenza artificiale generativa negli iPhone e in altri dispositivi nel mercato interno.

Sebbene non ci sia ancora alcuna conferma ufficiale, due cose sono certe:

  • iPhone 16, iOS 18 e MacOS saranno dotati di funzioni AI
  • I modelli di grandi dimensioni dei dispositivi Apple saranno forniti da diversi produttori in patria e all'estero

Rispetto ai marchi nazionali che hanno già dotato gli assistenti IA, questa volta Apple è in ritardo di oltre sei mesi: la lentezza sembra essere sempre stata la sua etichetta, ma può sempre portare qualche sorpresa pur andando avanti con fermezza.

Tuttavia, la velocità del progresso nei grandi modelli di intelligenza artificiale viene misurata in settimane o addirittura giorni: l'arrivo in ritardo di Apple è ancora una volta un ritardatario o l'inizio di una nuova era di ritardo?

Un piano leggermente compromesso, la chiave è salire prima sull'autobus

L’ultimo giorno del mese scorso, Apple ha annunciato, in una breve riunione di 12 minuti, che avrebbe rinunciato alla costruzione di automobili e avrebbe spostato il tutto nell’intelligenza artificiale, trasferendo molti membri del team automobilistico al dipartimento dell’intelligenza artificiale.

Il Progetto Titan, rimasto inattivo per dieci anni, non è riuscito nell'ultimo anno a introdurre veicoli a nuova energia. Ciò sarà un po' di rammarico per il futuro mercato automobilistico dove si contenderanno un centinaio di scuole di pensiero. Tuttavia, dal punto di vista del Lo sviluppo a lungo termine di un'azienda tecnologica non è altro che uno sviluppo a lungo termine e la scelta giusta.

L'intelligenza artificiale è un'applicazione di base. In un momento in cui tutte le principali aziende abbracciano attivamente o passivamente l'intelligenza artificiale, la "fuga" di Apple è in linea con i tempi, ma come abbracciare l'intelligenza artificiale? Che tipo di intelligenza artificiale può occupare un posto nel mercato gradualmente diviso? Questo è il primo problema che devono risolvere.

Per i mercati esteri, Apple sta negoziando attivamente con Google per aggiungere modelli di intelligenza artificiale di grandi dimensioni a iOS 18 per realizzare funzioni di intelligenza artificiale che altri marchi hanno già avuto.

Anche se "le due parti non hanno ancora deciso i termini o il marchio dell'accordo sull'intelligenza artificiale, né hanno definito le modalità di attuazione", tra i tanti partner alternativi (OpenAI e Anthropic), Google e Gemini dovrebbero essere i più adatti Apple e iPhone. .

I modelli della serie Samsung Galaxy S24 lanciati a febbraio di quest'anno sono dotati di funzioni AI fuori dall'ordinario. Funzioni come la traduzione delle chiamate e la scrittura creativa hanno raggiunto la media nazionale. La ricerca istantanea ha accorciato il percorso di ricerca ed è molto probabile che diventi la prima caratteristica principale dei telefoni cellulari AI nel futuro percorso di sviluppo.

La versione oltreoceano della serie S24 è in grado di completare le funzioni di cui sopra attraverso il supporto del modello Gemini di grandi dimensioni.

Per esperienza, Google ha completato i primi tentativi sul modello di punta con il più alto volume di spedizioni al mondo e, rispetto ai produttori popolari sul lato PC o Web, conoscono le abitudini operative, gli scenari di utilizzo e l'adattamento dei grandi dispositivi mobili modelli di telefono migliori. Cosa dovrebbe fare l'applicazione.

Inoltre, la stessa Google è più desiderosa di ottenere i progetti di Apple.

Secondo le statistiche della società internazionale di dati IDC, la quota di mercato globale degli smartphone di Samsung ha raggiunto il 19,4% nel 2023, mentre Apple ha raggiunto con successo il massimo del 20,1%.

Se vincesse Apple, il tasso di adozione di Gemini nei terminali di telefonia mobile in tutto il mondo raggiungerebbe il 40%, il che è estremamente positivo per una grande azienda modello di intelligenza artificiale che deve affrontare una concorrenza agguerrita.

Oltre a Google, anche Apple si è svegliata dal sogno.

A differenza di altri produttori che enfatizzano la "ricerca personale", Apple ha utilizzato fin dall'inizio la cooperazione per ottenere l'integrazione dell'intelligenza artificiale e ha anche le proprie considerazioni.

Prima di tutto, nell'attuale situazione di avvio ritardato e di progressi lenti, la "dottrina dell'uso" è un buon modo per competere rapidamente sul mercato. La cooperazione con Google può ridurre i costi di ricerca e sviluppo e imporre commissioni elevate, facilitando al tempo stesso il lavoro delle due società. conflitti, attuali pressioni normative.

In secondo luogo, la tecnologia dell'AIGC è molto buona, ma quando è stata implementata è stata molto criticata per le sue carenze in termini di etica, privacy e altri aspetti ed è stata consegnata a una terza parte matura, in particolare Google, che aveva testato con successo il terreno I modelli Samsung risparmiano fatica e preoccupazioni e riducono l’opinione pubblica e i rischi di responsabilità.

Un altro ostacolo in questo senso è la localizzazione della tecnologia. Ogni paese e regione ha requisiti diversi per la supervisione e le leggi correlate dei grandi modelli di intelligenza artificiale. L'implementazione della conformità legale è il prerequisito per competere per il mercato e sviluppare la tecnologia. Pertanto, è nata la doppia strada "nazionale + internazionale" .

Secondo la fruttuosa collaborazione iniziale tra Samsung e Baidu, Apple sceglierà questa strada che è stata "verificata come vera".

La funzione AI sulla versione National Bank della serie Samsung S24 è costituita in realtà da tecnologie di diversi produttori: la funzione di ricerca istantanea è fornita da Baidu e JD.com; il fotoritocco intelligente è completato dal modello di grandi dimensioni MiracleVision di Meitu Xiuxiu; il riassunto dell'articolo, intelligente La scrittura adotta il modello Wenxin Yiyan di Baidu.

Se Apple collaborerà anche con diversi produttori bisognerà ancora aspettare notizie successive, ma la collaborazione con Baidu è già una certezza.

Alla fine, ciò che Apple vuole fare non è un assistente vocale intelligente, ma un set completo di terminali AI. Tuttavia, secondo le rivelazioni di Macrumor, con gli attuali progressi della ricerca personale e dei risultati tecnici, i grandi modelli di Apple sono ancora lontani dal livello di aziende come Google e OpenAI.

Invece di affrettarsi a lanciare un chatbot intelligente, è meglio utilizzare prima soluzioni mature come transizione per guadagnare più tempo di ricerca e spazio di miglioramento per i modelli di grandi dimensioni sviluppati autonomamente.

Il mercato attuale è importante, ma la tecnologia di base del futuro è fondamentale

La cooperazione è il primo passo nella globalizzazione dell’intelligenza artificiale di Apple e l’obiettivo finale è quello di avere un grande modello di intelligenza artificiale autosviluppato.

Questo è un progetto che consuma denaro ed energia. Per non parlare della regressione, se fai progressi un po’ più lenti, potresti essere eliminato la prossima settimana. Un modello ampio e competitivo rappresenta spesso il dominio futuro e il potere contrattuale nel mercato.

Cook ritiene:

Crediamo che questa tecnologia, aprendo nuovi orizzonti nell’intelligenza artificiale generativa, possa ridefinire il futuro.

L’esplorazione di modelli di grandi dimensioni da parte di Apple è sempre stata all’ordine del giorno.

Il 15 di questo mese, gli ingegneri Apple hanno pubblicato silenziosamente un documento di ricerca, che descriveva in dettaglio il processo di sviluppo di un nuovo modello di intelligenza artificiale generativa chiamato MM1.

MM1 è una serie LLM multimodale con un massimo di 30 miliardi (30 miliardi) di parametri, che rappresenta l’ultimo risultato della ricerca di Apple sui modelli multimodali di grandi dimensioni.

In generale, il modello sviluppato da Apple è ancora indietro rispetto a Gemini e GPT4V in termini di risultati dei test, non mostra risultati sorprendenti come Sora nella generazione dei risultati, né esplora un nuovo percorso tecnico.

Tuttavia, può controllare varie variabili di dati e scoprire i fattori più critici che influenzano l'effetto di generazione del modello a confronto. Per dirla semplicemente, non è intrinsecamente potente, ma è bravo nell'osservazione, nella pratica e nel riepilogo. Dopo ripetuti tentativi, , può anche ottenere buoni risultati.

MM1 è composto da modelli densi e varianti MoE (Mixed Expert). Quando l'istruzione entra nel MoE, questo centro di comando stabilirà chiaramente se si debba andare al mercato orientale per acquistare un cavallo o al mercato occidentale per acquistare una sella.

Mentre i problemi vengono perfezionati e classificati, anche l'efficienza del calcolo viene migliorata e il consumo energetico operativo viene ridotto.

La pubblicazione di questo documento rappresenta i risultati graduali dell'esplorazione di Apple nel campo dell'intelligenza artificiale. Sebbene MM1 non abbia sovvertito il settore né stupito il mondo, i loro progressi possono ancora essere visti in oscuri termini professionali:

Il nostro modello di lavoro è sempre stato quello di fare prima il lavoro e poi parlarne, invece di essere scortesi di fronte a noi stessi. ——Tim Cook

Apple, che non ha rivelato troppi dettagli tecnici, in realtà sta ancora pianificando un'altra mossa: un grande modello lato terminale.

Già alla fine dello scorso anno, Apple aveva proposto un metodo per implementare modelli di grandi dimensioni in dispositivi “con memoria limitata” come l’iPhone in un articolo intitolato “Large-scale Language Models in Flash Memory: Efficient Large-Scale Language Model Inference under Memoria limitata."

I ricercatori affermano di aver implementato con successo LLM (Large Language Model) su iPhone e altri dispositivi con vincoli di memoria utilizzando la più recente tecnologia di memoria flash.

Questo progetto si chiama Apple GPT. La sua funzione principale è quella di archiviare i dati LLM direttamente nella memoria flash, ad esempio integrandoli in Siri. Rispetto al metodo di esecuzione tradizionale, la nuova tecnologia aumenta la velocità di inferenza di CPU e GPU fino a 5 volte. volte e 25 volte.

"I metodi di efficienza che abbiamo sviluppato consentono ai modelli di intelligenza artificiale di funzionare con il doppio dell'attuale capacità di memoria dell'iPhone", hanno affermato i ricercatori.

In altre parole, è possibile trasportare modelli di grandi dimensioni all'estremità laterale. Riducendo la quantità di dati trasmessi dalla memoria flash e migliorando il rendimento di ciascuna trasmissione, i dati LLM possono essere archiviati direttamente nella memoria flash.

Tecnologia a parte, Siri è il ponte tra noi e l'intelligenza artificiale

Il progresso è lento, le notizie sono poche e il layout è ampio. Questa è una panoramica dell'esplorazione dell'intelligenza artificiale da parte di Apple.

Ogni volta che vediamo che una certa tecnologia Apple è in ritardo rispetto al mercato e ai concorrenti, si dà alle persone l’illusione che sia “iniziata troppo tardi”. Infatti, sfogliando notizie e documenti sui brevetti rilevanti, scoprirai che spesso è la prima da distribuire Quel lotto, anche quello.

Nel 2023, Apple ha acquisito un totale di 32 società di intelligenza artificiale, classificandosi al primo posto tra i giganti della tecnologia nelle acquisizioni. L'acquisizione di Siri dovrebbe essere considerata come l'inizio dell'ingresso di Apple nel settore dell'intelligenza artificiale.

Nel 2010, Jobs fece una telefonata a Dag Kittlaus, il "padre di Siri", che portò Siri a unirsi ad Apple e a lanciare l'iPhone con un valore di oltre 200 milioni di dollari.

Siri originariamente era posizionato come assistente per ottenere informazioni in modo rapido e accurato o per gestire attività complesse.

Nella sua versione più primitiva, Siri può connettersi a 42 servizi di rete: dal sito di recensioni di ristoranti Yelp e dal sito di vendita di biglietti StubHub al sito di recensioni di film Rotten Tomatoes e al sito di calcoli matematici Wolfram Alpha.

In base alle istruzioni, Siri integrerà varie informazioni e risponderà all'utente. Siri può aiutare gli utenti ad acquistare biglietti, prenotare un ristorante o chiamare un taxi senza aprire un'altra app.

Queste "funzioni AI" che ora vengono vigorosamente promosse da AI Pin e altri assistenti intelligenti sembrano essere solo le "operazioni di base" di Siri più di dieci anni fa.

Tuttavia, l’esperienza reale di Siri è stata notevolmente separata dallo sviluppo esplosivo di grandi modelli di intelligenza artificiale.

Gli assistenti intelligenti sono imitazioni passive delle persone, rispondono a tutte le domande e rispondono alle richieste.

Il terminale AI è un approccio attivo alle persone. In base alle abitudini e preferenze personali dell'utente, dopo aver riassunto il passato e ragionato, gli daremo i suggerimenti e le risposte più adeguate in tempi e luoghi diversi, e potremo imparare e ottimizzare continuamente per diventare "privato ed esclusivo".

▲ Immagine da: x.com

Nel complesso, il ritardo di Apple è solo relativamente tardivo, perché i telefoni cellulari con intelligenza artificiale sono ancora nelle prime fasi di sviluppo.

In effetti, la maggior parte dei marchi nazionali ha già compiuto sforzi nella fase dei terminali AI, con più o meno le stesse funzioni e specialità diverse, tuttavia, l'usabilità di ogni modello di grandi dimensioni può essere considerata solo transitoria, fatta eccezione per l'eliminazione dell'IA degli album fotografici OPPO e dei veri e propri Elaborazione delle chiamate in tempo di Samsung. Per quanto riguarda le funzioni segmentate come la traduzione e le chiamate AI di Xiao Ai, la maggior parte dell'esperienza è ancora leggermente diversa da quella delle applicazioni AI indipendenti.

Oltre alle scoperte tecnologiche dei produttori, ciò è legato anche all’interfaccia aperta dell’App. Ad esempio, i modelli che non supportano il riepilogo delle chiamate vocali di WeChat perderanno gran parte dello spazio applicativo nella vita quotidiana.

Pertanto, l’integrazione di modelli, sistemi e app di grandi dimensioni, nonché l’esplorazione di nuove modalità di interazione, hanno ancora molta strada da fare. Prima di ciò, le funzioni dell’intelligenza artificiale non avevano ancora raggiunto il livello di influenza sulle decisioni di acquisto dei consumatori.

Nel primo anno dal lancio dell'intelligenza artificiale, l'obiettivo di Siri è quello di colmare il divario di oltre sei mesi con altri assistenti IA; e come parte importante del futuro layout di Apple, non vediamo l'ora di sapere che tipo di "Ancora una cosa" "Siri porterà a giugno. ".

# Benvenuti a seguire l'account pubblico WeChat ufficiale di aifaner: aifaner (ID WeChat: ifanr). Contenuti più interessanti ti verranno forniti il ​​prima possibile.

Ai Faner | Link originale · Visualizza commenti · Sina Weibo