Dopo aver utilizzato il browser ChatGPT per una settimana, ho reinstallato Chrome.

La scorsa settimana ho provato tutti i principali browser AI.

Atlas di OpenAI, Comet di Perplexity, Dia di Browser Company ed Edge Copilot sono tra i browser AI più popolari sul mercato, ognuno con i suoi punti di forza e le sue insidie.

Quale sarà il futuro dei browser? Questi prodotti offrono risposte completamente diverse.

Per dirla in parole povere, ci sono due fazioni.

L'approccio incrementale, rappresentato da Chrome ed Edge, prevede l'aggiunta di funzionalità di intelligenza artificiale ai browser tradizionali. Google, che detiene la quota di mercato globale più ampia, non vede la necessità di una revisione completa per soddisfare le abitudini della maggior parte degli utenti. L'intelligenza artificiale è semplicemente una funzionalità aggiuntiva; il browser rimane lo stesso.

Come la versione per l'estero di Chrome, anche Edge ha un pulsante per l'assistente AI nell'angolo in alto a destra, che apre la barra laterale. Tuttavia, Edge Copilot si orienta maggiormente all'interazione vocale e, nei test effettivi, l'accento cinese suonava un po' strano e non si adattava perfettamente agli scenari di utilizzo reali.

Il campo radicale, rappresentato da ChatGPT Atlas, considera l'intelligenza artificiale come il cuore del browser, progettando l'intero browser attorno alle conversazioni basate sull'intelligenza artificiale. In breve, il browser stesso è intelligenza artificiale.

Naturalmente, i browser moderni non si accontentano più di rispondere alle domande "cosa" e "perché", ma vogliono anche aiutarti con il "come". Ad esempio, Atlas e Comet supportano la modalità Agent, che consente loro di eseguire i comandi dopo averli impartiti.

Le conclusioni sono le seguenti:

  • ChatGPT Atlas: lo strumento più consigliato e potente, può davvero aiutarti a gestire pagine web e automatizzare le attività, ma al momento presenta vulnerabilità di sicurezza. È adatto agli utenti a pagamento di ChatGPT e a chi ha davvero bisogno dell'intelligenza artificiale per svolgere il proprio lavoro.
  • Perplexity Comet: aggrega le informazioni in modo completo, ma la sua esecuzione è lenta e meccanica e le sue capacità di agente sono deboli. È adatto agli utenti che desiderano effettuare ricerche e scrivere report.
  • Dia: Velocità massima, interfaccia minimalista, ma scarsa nei dettagli e in realtà non esegue alcuna operazione. Adatto ai primi utenti che desiderano una navigazione veloce (20 dollari al mese).
  • Edge Copilot: gratuito, con una struttura riassuntiva chiara, ma è troppo basato sull'intelligenza artificiale e sui modelli, e non esegue attività. È adatto agli utenti comuni che non vogliono smanettare o pagare.

Quale browser AI è meglio usare?

Abbiamo sottoposto questi browser ad alcune "domande di prova" per valutare la loro intelligenza artificiale.

Articolo riassuntivo

Dia è il più veloce, produce risultati in pochi secondi, è adatto per una consultazione rapida ma è carente di dettagli. Comet, invece, fornisce riassunti più solidi, delineando quasi tutti i punti principali dell'articolo.

Edge Copilot è in qualche modo simile a un editor multimediale professionale, in grado di estrarre livelli logici come "meccanismi pubblicitari" e "cambi di piattaforma", con un forte senso della struttura; tuttavia, è troppo incentrato sull'intelligenza artificiale.

L'Atlante è il più "umano" perché non si limita a catturare i fatti, ma si estende anche al livello dei valori, offrendo osservazioni con un tocco di prospettiva.

In breve: Dia cerca la velocità, Comet cerca la completezza, Edge cerca la stabilità e Atlas cerca la profondità.

In definitiva, la scelta dipende da quale azienda ha il modello di base più solido. Ad esempio, Atlas utilizza il proprio modello GPT, che le conferisce un vantaggio naturale giocando in casa.

Video riassuntivo

I sottotitoli restano un prerequisito per riassumere i video; altrimenti, anche l'intelligenza artificiale più esperta non riuscirebbe a cucinare senza ingredienti.

Sia Dia che Atlas possono generare riepiloghi adatti per rapide panoramiche e offrono anche un'analisi cronologica dettagliata, facilitando la presa di appunti. Tuttavia, Dia genera riepiloghi molto più velocemente.

Sebbene Edge Copilot abbia una forte componente di intelligenza artificiale, non solo riesce a comprendere il contenuto superficiale del testo, ma riconosce anche la posizione dell'autore e l'inclinazione emotiva nell'espressione, rendendola più chiara.

La prestazione della Perplexity Comet è stata mediocre: ha eseguito una serie di passaggi impressionanti ma alla fine ha fornito solo una panoramica mediocre.

Pianificare un viaggio

Abbiamo formulato una richiesta: "Vorrei andare da Shanghai a Guangzhou per due giorni questo fine settimana. Per favore, aiutatemi a pianificare l'itinerario, gli hotel e il budget."

Nel complesso, ChatGPT Atlas è per me il servizio che non mi crea più preoccupazioni.

Genera direttamente guide di viaggio complete, integrando tutto, dagli itinerari ai budget, e riassumendo informazioni da più piattaforme come Ctrip. È ricco di dettagli, con immagini e testo, il che lo rende più adatto a chi apprezza i dettagli quando viaggia.

Sebbene sia Edge Copilot che Comet forniscano elenchi di itinerari completi, Comet è leggermente più pratico, mentre Edge è più simile a un modello generato dall'intelligenza artificiale.

Dia, se utilizzato insieme alla ricerca Google, genera soluzioni direttamente, il che è comodo, ma la fonte delle informazioni non è chiara.

A dire il vero, al momento non possiamo fare affidamento solo sulle guide di viaggio generate dall'intelligenza artificiale; possono servire solo come linee guida generali. Per informazioni davvero affidabili, è comunque necessario consultare i post di esperienze di persone reali sui social media.

Chi può aiutarti concretamente con il lavoro?

Il miglior indicatore delle differenze tra i browser AI è la capacità di esecuzione di Agnet.

Abbiamo chiesto loro di "acquistare un iPhone 17 Pro Max dal sito web di Apple".

Dia può identificare rapidamente l'intento dell'utente e generare una chiara guida all'acquisto passo dopo passo (visita il sito Web ufficiale → seleziona il modello → seleziona il pagamento), fornendo dati specifici, ma non effettuerà effettivamente un ordine per te.

Edge Copilot è più simile a un "assistente AI per il recupero delle informazioni", in grado di analizzare rapidamente i comandi e descrivere accuratamente lo stato delle pagine web, ma in realtà non fa clic su nulla, offrendo solo un'interazione in stile domanda e risposta.

Schermata del browser Edge Copilot

Comet clicca, inserisce informazioni e naviga tra le diverse pagine, simulando un agente di acquisto umano durante tutto il processo. Tuttavia, è lento e si basa in gran parte sull'esecuzione meccanica fino alla fase finale: il pagamento.

ChatGPT Atlas non solo comprende il contenuto delle pagine web, ma può anche simulare operazioni, tracciare pagine diverse, organizzare file, generare report e persino eseguire script automatizzati. Ha anche capacità di memoria (ricordate il video di valutazione del robot che ho visto ieri?), e lo ricorda anche dopo un giorno.

Oltre allo shopping, anche confrontare i prezzi tra le diverse piattaforme è un'esigenza fondamentale.

Sebbene sia Comet che Atlas affermino di essere in grado di eseguire attività complesse, nei test effettivi i vantaggi di ChatGPT Atlas sono fin troppo evidenti.

La mia impressione è che Comet sia attualmente più simile a un assistente di ricerca intelligente basato sull'intelligenza artificiale. Il suo fulcro è ancora l'aggregazione di informazioni e l'esecuzione di compiti leggeri. Può integrare rapidamente più fonti di informazione, come pagine web, dati accademici e video, e generare briefing o risultati di confronto. Ha una velocità di risposta elevata, ma può eseguire solo compiti a passaggio singolo.

ChatGPT Atlas è un vero e proprio "agente esecutivo del browser" in grado non solo di comprendere il contenuto delle pagine web, ma anche di simulare le azioni dell'utente, come clic, digitazione, monitoraggio tra pagine, organizzazione di file e persino generazione di report o esecuzione di script automatizzati.

Questo forse conferma una cosa: nell'era dell'intelligenza artificiale, la soglia di innovazione a livello applicativo non è in realtà elevata; la vera barriera è il modello stesso. Chi ha il supporto dell'intelligenza artificiale può effettivamente progredire senza intoppi.

Non avere fretta di passare a un browser basato sull'intelligenza artificiale: devi conoscere queste insidie.

L'ecosistema delle estensioni di Chrome è già molto maturo. Vedendo questo, qualcuno potrebbe dire: installare qualche estensione in Chrome non è come usare Atlas?

Francamente, per compiti semplici come riassumere articoli e tradurre pagine web, le estensioni di Chrome sono sufficienti. Installare un'estensione consente di estrarre i punti chiave in pochi secondi, offrendo un'esperienza non molto inferiore a quella di un browser con intelligenza artificiale. Tuttavia, quando si tratta di attività complesse, le estensioni falliscono completamente.

La differenza più profonda risiede nella comprensione dell'Internet del futuro. L'Internet attuale è progettato per gli esseri umani; i layout delle pagine e la logica di interazione sono tutti incentrati sulla vista umana e sulle abitudini di clic. Ma cosa succederebbe se i principali utenti di Internet fossero l'intelligenza artificiale e gli agenti?

Il cuore di un browser non è più la navigazione, ma l'esecuzione. Non è necessario sapere su quale sito web si trovano le informazioni; basta dire all'IA cosa si desidera e lei le troverà, elaborerà e integrerà autonomamente.
Da un punto di vista pratico, questi browser basati sull'intelligenza artificiale adottano strategie più solide, supportando direttamente le estensioni di Chrome e facilitando la migrazione fluida degli utenti.

Naturalmente, sebbene tutti questi browser AI siano integrati in Chromium, OpenAI non è semplicemente un "wrapper".

Secondo il suo blog, ha riprogettato la relazione tra il browser e il motore sottostante attraverso la sua architettura OWL (OpenAI's Web Layer) sviluppata internamente e ha ricostruito l'interfaccia con framework nativi come SwiftUI, AppKit e Metal, ottenendo un avvio di secondo livello, una maggiore concorrenza e un ambiente operativo di agenti intelligenti più sicuro.

Il mio computer è un MacBook Air M2 e, in termini di esperienza utente, non c'è molta differenza in termini di prestazioni, velocità e stabilità. Inoltre, tutti i browser supportano l'importazione di segnalibri e schede verticali, che sono funzioni di base.

Vale la pena notare che i browser AI affrontano una grave minaccia alla sicurezza chiamata "attacco di iniezione di istruzioni indirette". In parole povere, questo comporta che gli hacker nascondano comandi dannosi all'interno di pagine web, e-mail e altri contenuti. Quando i modelli linguistici di grandi dimensioni analizzano questi contenuti, potrebbero erroneamente eseguire i comandi nascosti come se fossero i comandi effettivi dell'utente.

Secondo la ricerca di Brave, diversi prodotti presentano vulnerabilità, tra cui Perplexity Comet, il browser Fellou e il nuovo ChatGPT Atlas di OpenAI.

Questi attacchi potrebbero avere gravi conseguenze, che vanno dall'influenzare le decisioni di acquisto degli agenti di intelligenza artificiale al furto di dati privati, informazioni sensibili sulla posta elettronica, credenziali di account e persino all'iniezione di codice dannoso o all'impianto di malware.

Anche Dane Stuckey, responsabile della sicurezza informatica di OpenAI, ha pubblicamente riconosciuto questa settimana che gli attacchi di iniezione rappresentano una seria minaccia, ma ha ammesso che si tratta di un "problema all'avanguardia" per il momento privo di una soluzione chiara.

Per questo motivo, OpenAI ha dovuto adottare diverse misure, tra cui l'istituzione di un sistema di risposta rapida, l'esecuzione di test red team, il lancio di una modalità senza accesso e l'introduzione di una modalità di monitoraggio che richiede agli utenti di visualizzare il comportamento degli agenti in tempo reale quando operano su siti web sensibili.

La sfida più grande risiede nelle caratteristiche dell'agente AI stesso.

Come gli esseri umani, visitano siti web sospetti e cliccano su link pericolosi, ma mancano di buon senso e di intuito in materia di sicurezza, il che li rende altamente vulnerabili a essere fuorviati o addirittura dirottati da istruzioni accuratamente elaborate. Ancora più problematico è il fatto che questi attacchi sono estremamente furtivi, potenzialmente nascosti in immagini, screenshot, moduli, e-mail o anche solo testo bianco su sfondo bianco, il che li rende praticamente impossibili da contrastare.

Quindi, quale browser dovresti scegliere?

In termini di costi, il browser Atlas è gratuito, ma la sua "modalità agente" di base è disponibile solo per utenti come ChatGPT Plus/Pro, "vincolando" di fatto gli utenti ai suoi servizi principali. Comet adotta un approccio freemium, offrendo gratuitamente le funzionalità di base, ma con un limite al numero di attività dell'agente.

Dia opera con un modello di abbonamento (20 dollari al mese per le funzionalità di intelligenza artificiale), il che lo rende il modello più puro al momento, ma è un mercato di nicchia e non si basa principalmente sui ricavi pubblicitari. Tuttavia, il suo futuro è incerto dopo l'acquisizione da parte di Atlassian. Chrome ed Edge, d'altra parte, hanno i loro costi sostenuti dalle proprie attività pubblicitarie e cloud, il che consente loro di essere più generosi con le loro offerte.

Se sei già un utente assiduo di ChatGPT o un membro Plus/Pro a pagamento, Atlas sarà molto intuitivo e la curva di apprendimento sarà pressoché nulla. Allo stesso tempo, le sue capacità di esecuzione e memorizzazione sono decisamente più avanzate rispetto agli altri.

Se hai bisogno di un tracciamento rigoroso delle fonti per la ricerca, la raccolta dati e la redazione di report, Perplexity Comet è l'opzione più affidabile. Sebbene le sue capacità di esecuzione potrebbero non essere flessibili come quelle di Atlas, almeno non ti lascerà incerto a causa di fonti di informazione poco chiare.

Se vuoi provare l'intelligenza artificiale ma non vuoi complicazioni, Chrome ed Edge sono sufficienti. Sono compatibili con le estensioni di Chrome, hanno costi di migrazione bassi e sono gratuiti. Sebbene le loro funzionalità di intelligenza artificiale non siano rivoluzionarie, sono sufficienti per la maggior parte delle persone.

Se cerchi minimalismo e concentrazione e non ti dispiace spendere 20 $ al mese, Dia è una buona opzione; tuttavia, il futuro dei prodotti di nicchia è sempre un po' incerto.

#Benvenuti a seguire l'account WeChat ufficiale di iFanr: iFanr (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il ​​prima possibile.

ifanr | Link originale · Visualizza commenti · Sina Weibo