La suite di strumenti di intelligenza artificiale di Google supera ChatGPT e conquista il primo posto nell’App Store! | Guida utente inclusa
Pensavi che ChatGPT sarebbe rimasto in cima alla classifica? Ma questa settimana le cose hanno preso una piega diversa.
Google Gemini, con il suo software di editing delle immagini Nano Banana, recentemente molto popolare, è in cima alla lista dei programmi gratuiti dell'App Store , spingendo ChatGPT al secondo posto.
Gemini è al primo posto in tutte le categorie della classifica gratuita dell'App Store. Fonte immagine: https://apps.apple.com/us/charts/iphone/top-free-apps/36 ; 15/09/2025
Ciò significa che Google ha finalmente avuto il suo "momento esplosivo di intelligenza artificiale".
E Gemini è solo la punta dell'iceberg. Google offre anche una suite completa di strumenti di intelligenza artificiale, che spaziano dalla scrittura e dal disegno alla presa di appunti per lo studio e alla generazione di video. Oggi analizzeremo nel dettaglio la suite completa di intelligenza artificiale di Google.
Versione a risparmio di flusso:
- Gemini, come ChatGPT, è un assistente multiuso . Include funzionalità come nano banana (un popolare modello di immagine raw), Canvas, la generazione video Veo3, Storybook e Deep Research. Attualmente sono disponibili i modelli Gemini 2.5 Pro e Flash. Visita gemini.google.com per provarlo.
- NotebookLM, una knowledge base per ricerche approfondite : puoi caricare fino a 300 file e riassumere i documenti in sei tipologie, inclusi audio, video e mappe mentali. È lo strumento migliore per l'apprendimento e la ricerca. Indirizzo dell'esperienza: notebooklm.google
- Flow, generazione video di alta qualità : supporta schermo verticale 9:16, HD 1080p, prezzo più basso, gli utenti gratuiti riceveranno 100 punti al mese. Indirizzo dell'esperienza: flow.google
- La modalità AI offre alla ricerca la possibilità di ragionare e pensare : puoi aprirla direttamente nella casella di ricerca di Google per ottenere risultati più rigorosi e dettagliati rispetto al Riepilogo/Panoramica AI. Attualmente supporta cinque lingue, incluso l'inglese (ma non il cinese). Provala su: google.com/ai
- Gemini CLI: un versatile assistente locale : non solo uno strumento di sviluppo, ma anche in grado di scaricare video, convertire GIF e comprimere file. Link all'esperienza: github.com/google-gemini/gemini-cli
- AI Studio e Labs Google : altri gadget interessanti, genera un brano musicale, impara facilmente una nuova lingua, sperimenta l'ultimo e più completo modello linguistico di Google…Indirizzo dell'esperienza: ai.dev e labs.google
Gemini: più di una semplice app di chat, è anche una postazione di lavoro versatile.
La nano banana, di recente popolarità, ha il suo canale ufficiale principale, oltre alla versione web, l'app Gemini.
▲ Homepage di Gemini, con un promemoria permanente che promuove il modello di modifica delle immagini nano banana
Ma se si utilizza Gemini solo per l'editing fotografico, sarebbe uno spreco. Come ChatGPT, integra la funzione "memoria" nelle conversazioni e può essere integrato perfettamente con l'ecosistema Google.
▲ La funzione "Memoria" di Gemini
Per me, questo aggiornamento fondamentale, abbinato all'abbonamento Pro gratuito incluso in EducationMail, è sufficiente per trasferire la maggior parte delle mie conversazioni quotidiane.
Google ha recentemente aggiornato i limiti di utilizzo specifici per gli utenti di Gemini, sia gratuiti che a pagamento. Gli utenti della versione gratuita hanno accesso limitato a Gemini 2.5 Pro e Deep Research, ma il prezzo di Nano Banana è molto basso, quindi anche gli utenti della versione gratuita hanno a disposizione ben 100 opportunità di generazione.
Fonte dell'immagine: https://support.google.com/gemini/answer/16275805
Il vantaggio principale di Gemini 2.5 Pro è che ogni risposta ha un processo di ragionamento chiaro, simile a DeepSeek, ma molto più veloce. Questo vantaggio è ancora più evidente dopo l'aggiornamento di ChatGPT a GPT-5, che adotta un nuovo controllo del routing e la selezione automatica del modello.
Perché a volte ChatGPT non riesce a capire quale modello voglio che utilizzi per rispondere; e la mia espressione non è sempre abbastanza chiara da permettere al modello di comprendere le mie intenzioni.
Tuttavia, il prezzo da pagare per essere un programmatore loquace è quello di non essere un esperto di produttività. Come mostrato dalla classifica LMArena, Gemini è al primo posto nello sviluppo di testo, ma le sue capacità di sviluppo web sono inferiori a quelle di GPT e Claude. Fortunatamente, Google ha recentemente apportato patch a Gemini, migliorando l'esperienza utente nell'interazione con il software.
▲Gemini e ChatGPT svolgono lo stesso compito di sviluppo, quale preferisci?
Ad esempio, nello sviluppo web, Gemini Canvas ora supporta il clic diretto su un elemento nell'applicazione e l'apporto di modifiche mediante linguaggio naturale.
L'anteprima della tela di Canvas e ChatGPT ha la stessa funzione, entrambe molto intuitive, e trasforma la nostra creatività in applicazioni, giochi, infografiche e altri contenuti.
▲ Nuove funzionalità in Gemini Canvas: Seleziona e Chiedi. Ora puoi modificare in modo intuitivo qualsiasi parte della tua app web semplicemente cliccando sull'elemento e descrivendo le modifiche desiderate. Fonte immagine: https://x.com/GeminiApp/status/1965475292526551105
In secondo luogo, Gemini supporta finalmente il caricamento di file audio. Ciò significa che materiali ricchi di contesto, come registrazioni di riunioni e video di interviste, possono essere consegnati direttamente a Gemini per l'elaborazione, eliminando la difficoltà di organizzare e scrivere manualmente prompt complessi.
▲ ChatGPT continua a rispondere che lo strumento non può essere utilizzato
L'ultima notizia è che, secondo la comunicazione tra il fondatore di flowith Derek Nee e il team di ingegneri di Gemini 3, è stato rivelato che le capacità di Gemini 3.0 Flash supereranno quelle di 2.5 Pro.
Fonte dell'immagine: https://x.com/DerekNee/status/1965811795559653506
Analogamente alle condizioni utilizzate da ChatGPT, Gemini potrebbe avere ulteriori restrizioni sulla posizione degli account Google.
Indirizzo dell'esperienza: gemini.google.com
NotebookLM: la tua migliore base di conoscenza personale
Hai salvato un sacco di lunghi articoli e estratti di libri in inglese, ma finisci sempre per "leggerli più tardi"? NotebookLM è progettato per evitare che prendano polvere.
Basta inserire qualche articolo, rapporto o anche qualche estratto di libro e:
- Ti aiuta automaticamente a estrarre i punti chiave e a generare un appunto di studio chiaro e organizzato;
- Se ti piace la visualizzazione, puoi anche disegnare direttamente una mappa mentale, in modo da comprendere a colpo d'occhio la struttura dell'articolo;
- Vuoi saperne di più? Può anche proporti dei quiz basati sul materiale, per spingerti a rivedere e consolidare le tue conoscenze.
Ad esempio, l'ho già usato per organizzare i documenti. NotebookLM supporta il caricamento fino a 300 file e un'ampia gamma di tipi di file, inclusi PDF, txt, Markdown, audio e video. È in grado di riconoscerli.
▲ Ho caricato 297 articoli nello stesso campo di ricerca e NotebookLM è stato in grado di generare riassunti dei contenuti in vari formati basati interamente su questi file.
▲ Sei formati: resoconto testuale, anteprima podcast, introduzione video, mappa mentale, flashcard e quiz
Podcast e report di testo sono state le prime opzioni disponibili in NotebookLM e ora sono state ottimizzate.
I report testuali possono essere generati direttamente come blog, documenti di istruzioni, guide e altri formati. NotebookLM fornirà anche suggerimenti dinamici basati sulle informazioni presenti nella knowledge base; ad esempio, il caricamento di un articolo potrebbe suggerire la creazione di un white paper, mentre gli articoli di notizie potrebbero generare contenuti esplicativi; ora sono consentiti anche prompt personalizzati.
▲ Post del blog generato da NotebookLM
I podcast audio ora supportano più di 80 lingue e le tipologie di podcast si sono espanse dalle panoramiche ai contenuti approfonditi, per poi estendersi ulteriormente a varie tipologie come dibattiti e pensiero critico.
I nuovi video, quiz e flashcard aggiunti sono le mie funzionalità preferite. NotebookLM è molto utile, sia per aiutarmi ad assimilare le conoscenze sia per diffondere ulteriormente i contenuti.
Tuttavia, la ricerca presentata in questo articolo riguarda un argomento relativamente di nicchia, quindi la utilizzeremo solo per presentare le funzionalità di NotebookLM. Per studenti e ricercatori, è sicuramente uno degli strumenti più consigliati nell'ambito dell'intelligenza artificiale di Google.
In scenari applicativi più generali, può essere utilizzato per creare qualsiasi tipo di knowledge base. Ad esempio, nel caso d'uso ufficiale fornito da NotebookLM, una mappa mentale viene utilizzata per caricare i report finanziari del primo trimestre di più aziende, consentendo agli utenti di comprendere chiaramente e immediatamente il contenuto specifico dei report finanziari.
NotebookLM ha inoltre stretto una partnership con OpenStax (un fornitore di libri di testo gratuiti) per trasformare i suoi contenuti più popolari in quaderni interattivi, tra cui quaderni su argomenti quali biologia, chimica, psicologia e management.
In questa base di conoscenza di psicologia, ogni capitolo è corredato di quiz e schede di memoria per aiutarci a consolidare le conoscenze acquisite.
▲ Puoi scegliere il cinese come lingua. Link alla knowledge base: https://notebooklm.google.com/notebook/90a2ee5f-cccb-4c28-a356-bb1682cc8aeb
Gli argomenti e i livelli di difficoltà dei quiz e delle flashcard sono personalizzabili. Inoltre, sia per le flashcard che per i quiz, è sufficiente cliccare sulla spiegazione per approfondire l'argomento. NotebookLM genera panoramiche dettagliate per aiutarti a comprendere le definizioni delle flashcard o a spiegare perché hai risposto male a una domanda, insieme alle citazioni del materiale originale.
Indirizzo dell'esperienza: notebooklm.google
Generazione video AI cinematografica di Flow
Sebbene i video basati sull'intelligenza artificiale siano incredibilmente popolari, la domanda su come possano effettivamente essere utilizzati rimane un interrogativo ricorrente per molti. Abbiamo trattato diversi modelli di generazione di video basati sull'intelligenza artificiale e molti lettori hanno commentato: "A chi servono davvero questi video basati sull'intelligenza artificiale?"
▲ In Gemini, utilizzare direttamente la generazione video Veo 3. Veo 3 attualmente supporta solo il primo fotogramma, mentre il primo e l'ultimo fotogramma richiedono Veo 2.
L'aggiornamento di Google potrebbe fornire alcune risposte: il supporto per lo schermo verticale (9:16) e l'HD 1080p. Questa funzionalità è senza dubbio pensata su misura per piattaforme social di video brevi come TikTok, YouTube Shorts e Reels.
▲ Veo 3 è stato aggiornato di recente, il prezzo di Veo 3 Fast è sceso da $ 0,4 al secondo a $ 0,15 al secondo e supporta 9:16, 1080p, ecc. Fonte immagine: https://x.com/GoogleAIStudio/status/1965436154762920074
Oggigiorno, i video basati sull'intelligenza artificiale sono diventati un nuovo prodotto di consumo di contenuti. Invece di guardarli passivamente, è meglio provarli in prima persona.
▲ Parole chiave: Video cinematografico ultra realistico di Shanghai, famosa torre simbolo. Girato in formato verticale 9:16, stile vlog di viaggio, movimento della telecamera fluido, illuminazione dinamica, colori vivaci, atmosfera altamente dettagliata e immersiva, senza testo, senza filigrana.
Oltre ai modelli di generazione video più popolari come Sora, KeLing e Conch, Veo 3 di Google è sempre stato tra i migliori nel settore dei modelli di grandi dimensioni, nella categoria dei video Vincent.
Il viaggio nel tempo in prima persona, il taglio della frutta tramite ASMR, il monitoraggio del metallo, la visione notturna tramite trampolino per conigli e altri video diventati virali qualche tempo fa sono stati tutti generati utilizzando Veo 3.
▲ Suggerimento: Fotocamera da 50 mm, primo piano di un limone in vetro giallo tagliato orizzontalmente su un tagliere di legno. Anche l'interno del frutto è in vetro con un po' di glitter sciolto. L'intera scena è illuminata dall'alto con una luce soffusa.
Tuttavia, la qualità delle parole chiave è il collo di bottiglia che determina la qualità del video. Ad esempio, il video qui sopra è preso direttamente in prestito dal caso ufficiale di Google.
Hanno spiegato che un buon prompt è composto da tre parti. La prima parte è "Fotocamera 50 mm, primo piano" per specificare la telecamera; la parte centrale serve per suggerire l'oggetto e il contenuto video specifico; e l'ultima frase chiarisce ulteriormente l'illuminazione e la texture.
Flow ha requisiti di rete rigorosi e in genere è sufficiente utilizzarlo sul sito web di Gemini o nell'app.
Indirizzo dell'esperienza: flow.google
La modalità AI supporta più lingue oltre all'inglese
La ricerca è l'ingresso principale del traffico, quindi i browser AI sono diventati un campo di battaglia per i grandi produttori di modelli, anche se questa strada non è facile.
Dopo l'interruzione del progetto Arc, il browser Dia, rilanciato, è stato recentemente acquisito da Atlassian per 610 milioni di dollari. Il problema non è la mancanza di profitti, ma piuttosto l'elevato numero di giganti della tecnologia desiderosi di acquisire questo redditizio business.
Il mese scorso, Microsoft ha annunciato l'aggiornamento del suo browser Edge a una versione basata sull'intelligenza artificiale, con Copilot perfettamente integrato in ogni angolo del browser, consentendo prenotazioni di ristoranti e voli, organizzazione di più schede e altro ancora. Quando OpenAI ha lanciato il suo agente ChatGPT, si vociferava anche che stesse sviluppando un proprio browser basato sull'intelligenza artificiale.
Naturalmente, Google non si fermerà qui. A differenza della Panoramica AI che di solito vediamo quando effettuiamo ricerche su Google, la Modalità AI è più simile a un report di ricerca approfondito. Utilizzerà il ragionamento avanzato e le capacità multimodali di Gemini 2.5 per elaborare i nostri input di ricerca.
Ad esempio, quando gli ho chiesto cosa stesse succedendo alla scheda eSIM dell'iPhone Air, il contenuto della pagina web è stato automaticamente riordinato e la risposta è stata più precisa.
▲ Fai clic su Tutto qui sopra per tornare alla normale ricerca Google
Tuttavia, la modalità AI ha un inconveniente: al momento non supporta il cinese. Tuttavia, pochi giorni fa, Google ha annunciato il supporto per altre cinque lingue, tra cui giapponese, coreano e portoghese. L'azienda ha affermato che sviluppare una ricerca AI globale è più di una semplice traduzione: le lingue supportate dovrebbero essere pertinenti e utili a livello locale.
Indirizzo dell'esperienza: google.com/ai
Gemini CLI scarica video e converte i formati dei file.
Non importa se Claude Code è esaurito, Gemini CLI è davvero facile da usare.
Abbiamo già detto che usare questo strumento terminale per modificare i nomi dei file è in realtà il modo più debole per usarlo. Ultimamente, ho usato Gemini CLI per tutto, dal download di video da X Video e YouTube, alla conversione di video in GIF e altri formati, fino alla compressione di immagini e video.
Il processo di installazione di Gemini CLI è piuttosto chiaro e, anche se si riscontrano problemi di configurazione dell'ambiente, l'intelligenza artificiale odierna può fornire soluzioni affidabili.
Il problema iniziale riguarda principalmente l'installazione di Node.js. Per gli utenti Windows, l'utilizzo del terminale non è intuitivo come su macOS e Linux, quindi è necessaria un po' di pazienza.
Dopo aver installato Node.js, segui le istruzioni su GitHub ed esegui il comando npm/npx per installare Gemini CLI.
Digitando "gemini" nel terminale, verrà richiesta la verifica. In genere, è sufficiente accedere con Google Authentication e non è necessario creare operazioni aggiuntive come l'API Gemini. Gli utenti della versione gratuita possono effettuare 60 richieste al minuto e 1.000 richieste al giorno, il che è sufficiente per flussi di lavoro quotidiani semplici.
Ci sono alcuni comandi molto basilari nel terminale. Quando apriamo il terminale, la cartella predefinita potrebbe contenere i file dell'intero computer. Se digitiamo direttamente gemini, sarà problematico recuperare i file.
Il funzionamento corretto è quello di immettere alcuni comandi di base: ls: elencherà tutti i file e le cartelle nella directory corrente; cd xxx: immette una cartella; mkdir xxx: crea una cartella.
Ad esempio, nel primo passaggio, apriamo il terminale e digitiamo ls per visualizzare tutti i file e le cartelle nella directory corrente. Successivamente, selezioniamo un file su cui lavorare: questa volta, ci servirà la cartella del progetto Gemini. Digitiamo cd Downloads e vedremo il nome della directory corrente, Downloads, preceduto dal carattere %. Successivamente, creiamo una cartella, mkdir testing, e ci entriamo usando cd testing. In alternativa, è possibile selezionare direttamente una cartella, fare clic con il pulsante destro del mouse e aprirla nel terminale. Digitiamo gemini e il terminale verrà ufficialmente gestito, consentendo di utilizzare il linguaggio naturale per gestire molte attività complesse.
Prendiamo come esempio il download di un video chiamato X. Per prima cosa, cerca uno strumento chiamato yt-dlp, che può essere utilizzato per scaricare video. Quindi, controlla automaticamente il mio computer per vedere se lo strumento è installato. Una volta rilevato, il video inizia a essere scaricato.
Questo strumento richiama yt-dlp. Nell'ambiente terminale sono disponibili molti strumenti efficienti, come FFmpeg, un potente strumento per l'elaborazione di contenuti multimediali.
▲ Dopo aver inserito il comando, Gemini CLI ti dirà direttamente che sono necessari due strumenti: yt-dlp e ffmpeg; quindi regolerà automaticamente la risoluzione e il frame rate per adattarli alla dimensione finale del file da me proposta e infine eliminerà i file temporanei nel processo.
Continuiamo a usare l'esempio del video X. Questa volta, gli chiediamo direttamente di scaricare il video di questo link come file GIF e di assicurarci che la dimensione del file GIF sia compresa tra 5 e 10 MB.
Oltre a scaricare file da Internet, Gemini-CLI può anche elaborare direttamente file locali. Ad esempio, se ho un'immagine le cui dimensioni non soddisfano le specifiche di caricamento della piattaforma, posso indicarle il nome del file e chiederle di comprimerla. Non è necessario cercare strumenti online durante il processo.
Ho potuto specificare la posizione dell'immagine usando il linguaggio fuzzy e il programma l'ha individuata correttamente. Ha poi usato ffmpeg per comprimerla. Tuttavia, ha finito per cancellare il mio file originale. Quando gli ho chiesto di recuperarla, ha modificato il suo file di configurazione gemini.md: questo funge da "memoria", assicurandosi di ricordare la lezione ed evitando di commettere lo stesso errore in futuro.
Esistono molti tipi di strumenti da riga di comando e quasi la maggior parte dei file può essere elaborata. A volte, se alcuni pacchetti compressi non possono essere decompressi, è possibile utilizzare Gemini CLI per gestirli direttamente senza scaricare gli strumenti di decompressione corrispondenti.
In combinazione con MCP (Large Model Context Protocol, un'interfaccia universale per la connessione di dati diversi), Gemini CLI può fare molto di più che un semplice sviluppo di programmazione.
Indirizzo dell'esperienza: https://github.com/google-gemini/gemini-cli
AI Studio and Labs Google: il banco di prova all'avanguardia per l'intelligenza artificiale di Google
Google Labs ospita molti prodotti basati sull'intelligenza artificiale che non sono ancora stati rilasciati ufficialmente. Progetti come AI Mode e NotebookLM sono ancora prodotti di laboratorio, ma sono piuttosto noti. Abbiamo anche selezionato alcuni interessanti progetti più piccoli. Sebbene i modelli di base siano tutti basati sullo stesso processore Gemin 2.5 Pro/Flash, è possibile dare un'occhiata alle diverse implementazioni software all'interno dei modelli.
Il primo è Whisk, uno strumento di generazione di immagini che non richiede alcun prompt e permette di caricare foto e divertirsi. Ora ha aggiunto la funzione di animazione, che converte direttamente le immagini generate in un video.
▲ Indirizzo: https://labs.google/fx/tools/whisk
Esistono anche le Little Language Lessons per imparare una lingua. Ciò che le rende speciali è che ci permettono di apprendere rapidamente una nuova lingua attraverso una serie di piccoli esperimenti basati su Gemini, di applicarla direttamente a scenari reali e di apprendere diverse espressioni gergali.
L'ho provato in cantonese e almeno non erano i soliti involtini di riso e costine di maiale in salsa di fagioli neri di Duolingo.
▲ Indirizzo: https://labs.google/lll/
Google Labs ha molti altri progetti, scoprili su: labs.google
Abbiamo parlato del modello di grandi dimensioni Gemini 2.5 Pro, pensato per un uso generico, del nano banana per l'editing di immagini e della generazione video Veo 3, quindi come non parlare di Imagen 4?
Attualmente, Imagen 4 può essere utilizzato solo tramite l'API Gemini e AI Studio. Sebbene Google Labs disponga di uno strumento dedicato alla generazione di immagini, ImageFX, il modello utilizzato è ancora Imagen 3.
AI Studio ti consente di sperimentare i modelli più recenti e completi di Google. Inoltre, le conversazioni all'interno di AI Studio offrono una funzione di "ramificazione", che consente di avviare un nuovo argomento mantenendo quello esistente.
Qualche tempo fa, Musk ha litigato con Ultraman su X e si sono insultati a vicenda, dicendo che Apple e Ultraman avevano un accordo privato, altrimenti perché il suo Grok non poteva essere in cima alla lista e perché era sempre ChatGPT.
Dopo averlo scartato, mi sembra di intravedere i punti di forza di Gemini. L'intelligenza artificiale di Google si integra perfettamente nei nostri processi di apprendimento, lavoro e creatività con un flusso di lavoro completo. Dall'organizzazione dei dati allo stimolo della creatività e alla liberazione delle mani, il fulcro di questa suite completa è migliorare davvero la produttività di tutti.
Quale usi di più o vorresti provare di più? Lascia un commento qui sotto se hai domande.
Clicca sul link per riprodurre il video su WeChat https://mp.weixin.qq.com/s/gdSkrm95Mq1RORe-sIoK4A
#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.