Oh no! Sono diventato un agente!

In qualità di utente di un telefono Pixel che utilizza il telefono da sei anni e mezzo, ieri mattina ho guardato la conferenza Made by Google con il cipiglio in faccia.

#MortoDentro

In quanto prodotto di decima generazione della linea, Pixel 10 non ha portato con sé una trasformazione dalla forma del prodotto alla forma d'uso come il precedente iPhone X. Ha invece adottato un approccio conservativo in un momento in cui anche l'iPhone si stava preparando a subire importanti cambiamenti nel design.

Solo dal punto di vista hardware, i quattro nuovi telefoni Pixel di quest'anno (10, 10 Pro, Pro XL e Pro Fold) non hanno altri punti di forza oltre al processore TSMC, e le loro capacità di imaging hanno visto sia progressi che battute d'arresto.

Un tempo avevamo un nome più appropriato per questo aggiornamento: Pixel 9s.

Considerando che il prodotto in sé è già nella media, la conferenza Made by Google è ancora più difficile da descrivere.

Da una prospettiva normale, lo scopo del lancio di un prodotto dovrebbe essere quello di presentare e presentare chiaramente il prodotto, evidenziarne il più possibile i vantaggi e poi comunicarne a tutti il ​​prezzo.

Ma Google sembra avere idee diverse sul lancio.

L'evento Made by Google di quest'anno è stato più un meeting annuale di Google altamente commerciale che una conferenza stampa. Nemmeno Jimmy Fallon è riuscito a ricostruire le varie scene frammentate per rispondere alla domanda più importante:

Quali sono le novità del Pixel di quest'anno?

Il vero hardware AI richiede solo il fattore di forma più semplice

Dobbiamo ammetterlo: Google, con i suoi strumenti Gemini, Veo 3, Flow, Genie 3 e altri, è senza dubbio uno dei modelli di intelligenza artificiale più potenti del pianeta, e non ne ha nemmeno bisogno.

Genie 3 può generare "ambienti di simulazione interattivi" in tempo reale a 720P 24 frame, anziché video. Youtube @Fireship

Google è naturalmente consapevole del valore dell'affermazione di Alan Kay secondo cui "le persone che prendono sul serio il software dovrebbero realizzare il proprio hardware". Lo si può vedere dal fatto che dieci anni fa Google ha abbandonato la serie di telefoni cellulari Nexus, realizzati internamente, ed è passata a un processo di sviluppo completamente interno per Pixel.

Il problema è che, nel tempo, la definizione di "software" cambia:

  • La prima generazione di Pixel del 2016 rappresentava un hardware standardizzato per il sistema Android.
  • Nel 2017, il Pixel 2 rappresentava l'hardware standardizzato per la fotografia computazionale.
  • Il Pixel 6 del 2021 torna all'hardware standardizzato per il design Material You basato su Android 12.

Per quanto riguarda il Pixel 10 di quest'anno, dopo aver esaminato l'intera conferenza stampa, la redazione di iFan ritiene che le intenzioni di Google siano già chiare:

La serie Pixel 10 è un set di hardware AI progettato interamente per Gemini. Che si tratti del Rabbit R1, dell'Humane AI Pin o dell'accessorio AI sviluppato da OpenAI e Jony Ive, rispetto al Pixel 10, bisogna ammettere che non sono abbastanza puri.

Se utilizziamo la formula di Alan Kay per descriverlo, Google è in realtà gradualmente passata dal "prendere abbastanza sul serio il sistema Android" al "prendere abbastanza sul serio l'intelligenza artificiale": il telefono Pixel, in quanto versione hardware, non richiede alcuna modifica.

Foto|PhoneArena

In altre parole, la serie Pixel 10 di quest'anno non è poi così importante né per Android 16 né per la fotografia computazionale di Google.

Al contrario, Pixel 10 è un'estensione reale del Gemini, un portale per l'intelligenza artificiale da 799 dollari che può anche effettuare chiamate e scattare foto.

Ma questo non è l'hardware di intelligenza artificiale che vogliamo.

Naturalmente, non c'è nulla di sbagliato nel fatto che Google abbia reso Pixel un portale hardware esclusivo per Gemini. Dopotutto, per quanto l'aspetto hardware del telefono possa essere migliorato, è molto più pratico dell'aspetto volutamente differenziato di Rabbit R1 e Humane AI Pin.

Immagine: CNET

Tuttavia, anche se l'attuale Pixel può essere considerato un hardware AI, non risolve ancora un problema molto importante:

La sua logica di funzionamento è diversa dall'hardware AI che ci aspettavamo.

Che si tratti di fantascienza o di rappresentazioni concettuali, spesso diamo all'IA una forma concreta con una funzione, che si tratti di un Terminator T-1000 fatto di metallo liquido o degli occhi rossi di HAL 9000 e MOSS:

Immagine|The Wandering Earth Wiki

Poiché possiamo accettare MOSS installato nello chassis, non c'è nulla di sbagliato nell'installazione di Gemini nel telefono Pixel. Il problema è che il modo in cui gli utenti utilizzano Gemini è molto diverso da come Liu Peiqiang immaginava di utilizzare MOSS.

Nel corso di questa conferenza stampa, le due nuove funzionalità di intelligenza artificiale che Google ha principalmente illustrato, Camera Coach e Magic Cue, nonché la modifica delle foto Gemini nell'album, sono tutte sparse in varie funzioni del sistema e alcune appariranno solo durante l'uso .

Ciò è completamente in contrasto con l’idea che la gente aveva dell’intelligenza artificiale negli ultimi decenni.

Non ho bisogno che Magic Cue visualizzi sullo schermo informazioni rilevanti sulla conversazione solo dopo aver effettuato una chiamata. Voglio che l'intelligenza artificiale controlli automaticamente le informazioni del mio itinerario e l'email di prenotazione e, se trova qualcosa di sbagliato, chiami in modo intelligente la compagnia aerea per rimborsare il biglietto.

Non ho bisogno che Google Foto mi obblighi a cliccare sul pulsante Modifica prima che si apra la finestra di dialogo di Gemini. Devo attivare Gemini direttamente: aiutarmi a eliminare le foto sfocate nelle 200 foto del bar che ho appena scattato, regolare la luminosità e il colore e poi selezionare 9 foto di cocktail diversi da pubblicare su WeChat Moments .

Nelle opere di fantascienza e nei concetti di intelligenza artificiale dell'ultimo decennio, la logica operativa dell'intelligenza artificiale dovrebbe essere che gli utenti umani impartiscano istruzioni, l'intelligenza artificiale comprenda automaticamente le istruzioni e combini attivamente tutte le risorse circostanti per eseguire automaticamente le attività , piuttosto che io usi una sedia a rotelle per mandare l'intelligenza artificiale davanti al tavolo, darle penna, inchiostro, carta e pietra per inchiostrare e poi iniziare a dipingere.

Immagine: 36Kr

In altre parole, le funzionalità di intelligenza artificiale del Pixel sono ora distribuite in tutto il sistema . È necessario avviare un'attività prima di poter ottenere l'aiuto corrispondente dall'intelligenza artificiale: questo include molte funzioni che avrebbero potuto essere facilmente collegate e gestite dall'intelligenza artificiale per conto nostro, come la pubblicazione di foto su un determinato social software.

Sette anni fa, Bixiby poteva utilizzare l'adattamento attivo per implementare funzioni applicative simili, ma Pixel, con la sua maggiore integrazione hardware e software, non può farlo. | YouTube @爱否科技

Ciò che è ancora più difficile da comprendere è l'assistenza alla composizione Camera Coach integrata nella fotocamera. Quando abbiamo visto la dimostrazione per la prima volta, pensavamo che potesse leggere il contenuto dello schermo in tempo reale e generare suggerimenti di composizione tramite l'interfaccia sottostante del sistema.

Tuttavia, la realtà è che devi attivare manualmente la funzione e Gemini scatterà silenziosamente una foto e ti consiglierà diversi metodi di composizione in base ad essa: se la prospettiva non corrisponde, chiamerà direttamente l'intelligenza artificiale per aiutarti a disegnarla approssimativamente, e poi regolerai la posizione poco a poco in base alle indicazioni dell'intelligenza artificiale finché non premerai l'otturatore:

Immagine | YouTube @9to5Google

Per non parlare di come è stata concepita l'operazione di interruzione del flusso di alzare deliberatamente la mano per cliccare: l'intera funzione Camera Coach sembra essere qualcosa che Google ha forzato per trovare un modo per integrare i KPI funzionali del reparto Gemini e del reparto Pixel.

L'intento originale dell'assistenza alla composizione dovrebbe essere quello di aiutarti a scattare foto, ma dopo tale operazione, anche con la potenza di calcolo di Tensor G5 che supporta il piccolo modello alla fine, l'attuale velocità di inferenza e i risultati dei suggerimenti non sono così soddisfacenti.

In attesa delle operazioni dell'IA, i nostri amici più efficienti hanno già cambiato diverse posizioni, spostandosi in avanti e indietro, a sinistra e a destra, in alto e in basso per scattare una serie di foto e possono sfruttare al meglio le prestazioni dell'ISP aggiornato del Tensor G5.

Questa inversione di controllo, come altre funzionalità di Gemini AI in Android 16 che richiedono di eseguire alcune azioni prima di intervenire, sovverte completamente le nostre precedenti aspettative sull'intelligenza artificiale.

Come sono diventato un agente che trasporta dati e fornisce informazioni a Gemini?

Ironicamente, usare i Gemelli per generare

Pensatela da un'altra prospettiva. Pixel 10 non è un telefono con intelligenza artificiale per le persone, ma piuttosto un telefono con intelligenza artificiale per Gemini. Tutte le nuove funzionalità vengono utilizzate dalle persone che forniscono informazioni a Gemini, che vengono poi integrate dall'intelligenza artificiale.

Sebbene questo tipo di IA distribuita nei processi funzionali impedisca oggettivamente un coinvolgimento eccessivo, può anche dare l'impressione che l'IA stia prendendo il sopravvento sull'esperienza utente. Gemini è come un genitore che costruisce un castello di sabbia con il proprio figlio. Aspetta che il bambino raccolga la sabbia e faccia una richiesta prima di iniziare a modellare il contorno del castello.

Inoltre, una cosa di cui dobbiamo essere cauti è che Pixel 10 può facilmente diventare un cattivo esempio per gli altri produttori di telefoni cellulari: un cattivo esempio che si affida solo ai progressi dell'intelligenza artificiale e ignora le basi hardware.

Immagine: Android Central

Se Google continuerà a usare le stesse tattiche in futuro, si otterrà un risultato pessimo: il Pixel che gli utenti Pixel desiderano scomparirà e il vero telefono AI che gli utenti AI desiderano non sarà affatto così .

Questa forma di prodotto futuro è probabilmente qualcosa che né Google né i consumatori vogliono vedere.

#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

iFanr | Link originale · Visualizza commenti · Sina Weibo