Microsoft rilascia un report di valutazione GPT-4V di 166 pagine, in cui viene riscontrato l’utilizzo avanzato di ChatGPT | Hunt Good Weekly Report

Sintonizzati sull’ultimo numero di Hunt Good Weekly!

In questo numero vedrai:

6 novità fresche
3 strumenti utili
3 punti di vista distinti
1 caso interessante

A caccia di notizie|Titoli avanzati

 Giganti dell’intelligenza artificiale come Microsoft e OpenAI stanno esplorando chip AI sviluppati autonomamente

Secondo Reuters, OpenAI sta esplorando la possibilità di produrre i propri chip AI e ha valutato potenziali obiettivi di acquisizione.

OpenAI ha discusso varie opzioni per affrontare la carenza di chip AI almeno dallo scorso anno, hanno detto persone che hanno familiarità con la questione. Questi piani includono chip AI sviluppati internamente, una più stretta collaborazione con produttori di chip come NVIDIA e la diversificazione dei fornitori.

La società non ha ancora deciso di andare avanti, afferma il rapporto. Il CEO di OpenAI, Sam Altman, ha precedentemente affermato che l’acquisizione di più chip AI è stata la massima priorità dell’azienda.

Si è lamentato pubblicamente della scarsità di GPU, un mercato dominato da Nvidia. Dal punto di vista di Altman, OpenAI deve affrontare molti problemi, come la carenza di processori avanzati e gli elevati costi operativi dell’hardware.

I veterani del settore hanno affermato che i chip sviluppati internamente da OpenAI costituiranno una mossa strategica importante e un investimento enorme, con costi annuali che potrebbero raggiungere centinaia di milioni di dollari. Anche se OpenAI dedica risorse all’attività, il successo non è completamente garantito.

Rispetto all’esitazione di OpenAI nello sviluppo dei propri chip AI, Microsoft è in anticipo sui tempi e prevede di lanciare il primo chip dell’azienda appositamente progettato per l’intelligenza artificiale durante la conferenza annuale degli sviluppatori il mese prossimo.
Il chip di Microsoft è simile alla GPU di Nvidia ed è progettato per server di data center che addestrano ed eseguono modelli linguistici di grandi dimensioni.
Qualcuno a conoscenza della questione ha affermato che alcuni dipendenti di Microsoft e OpenAI hanno testato i chip per server AI di Microsoft e che, sviluppando chip AI sviluppati autonomamente, Microsoft raggiungerà sostanzialmente Amazon e Google.
Microsoft spera che il chip sia paragonabile alla GPU H100 di Nvidia, ma maggiori prestazioni dovranno attendere fino al suo debutto effettivo il mese prossimo.

 https://www.reuters.com/technology/chatgpt-owner-openai-is-exploring-making-its-own-ai-chips-sources-2023-10-06/

 Microsoft rilascia un rapporto di valutazione GPT-4V di 166 pagine, una lettura obbligata per gli utenti avanzati

In un articolo precedente, abbiamo riportato che ChatGPT ha inaugurato un aggiornamento epocale, che è passato dal semplice testo “che va e viene” all’immagine “che va e viene”, realizzando analisi e dialoghi basati su immagini. Puoi semplicemente intenderlo come un cambiamento da GPT-4 convertito in GPT-4V(ision).

Mentre le persone erano ancora immerse nello studio del gameplay di GPT-4V, il “grande proprietario” di OpenAI, Microsoft, ha rilasciato direttamente un rapporto di 166 pagine che descrive in dettaglio i test e l’utilizzo di questa funzione.

Tanishq Mathew Abraham, co-fondatore e CEO di MedARC (Centro di ricerca sull’intelligenza artificiale medica), ha dichiarato: “Questo rapporto sarà una lettura obbligata per gli utenti avanzati di GPT-4V”.

Nello specifico, questo rapporto è suddiviso in 11 capitoli, tra cui panoramica del documento, modalità di input GPT-4V, modalità di lavoro GPT-4V e tecnologia di prompt, abilità nel linguaggio visivo, interazione con gli esseri umani: prompt di riferimento visivo, tempo e ricerca sulla comprensione dei video, visual test di ragionamento e QI, test di intelligenza emotiva, punti salienti delle applicazioni emergenti, agenti basati su LLM, ecc.

Anche il metodo di test è molto semplice: inserendo Prompt (parola di suggerimento), l’autore del rapporto può porre domande a GPT-4V.


Ad esempio, l’autore del report ha inserito una foto dell’emblema delle Nazioni Unite e ha chiesto a GPT-4V di scrivere il codice SVG per generare una foto dell’emblema delle Nazioni Unite. Sfortunatamente, l’effetto finale generato non è stato molto buono, o addirittura un po’ pessimo.

Naturalmente, gli esempi sopra riportati sono solo alcuni esempi, infatti, in tutto il rapporto, GPT-4V ha ottenuto buoni risultati in termini di capacità di ragionamento logico, capacità di riconoscimento delle immagini e capacità di comprensione multimodale.

Ad esempio, quando l’autore del rapporto ha “dato in pasto” a GPT-4V una foto di Jen-Hsun Huang, GPT-4V è stato comunque in grado di identificare con precisione l’identità del CEO e co-fondatore di NVIDIA e i comportamenti specifici nella foto.

Per motivi di spazio non fornirò esempi uno per uno. Il link al rapporto è il seguente. Benvenuti a leggerlo.

 https://arxiv.org/pdf/2309.17421.pdf

 Meta paga milioni ai migliori creatori per creare personaggi IA utilizzando le loro sembianze

Secondo The Information, Meta ha pagato star come Snoop Dogg, Tom Brady, MrBeast e Charli D’Amelio per usare le loro sembianze per creare personaggi virtuali di intelligenza artificiale.

Per molti dei migliori creatori, i compensi potrebbero ammontare a milioni nel corso degli anni, secondo persone che hanno familiarità con la questione.

Attualmente, questi ruoli sono principalmente chatbot testuali su Instagram, WhatsApp e Messenger, ma Zuckerberg ha affermato che anche le funzionalità vocali verranno lanciate all’inizio del prossimo anno.

Collaborando con celebrità di alto profilo, Meta potrebbe cercare di attingere al vasto pubblico che queste star hanno accumulato su diverse piattaforme.

I creatori che sono diventati famosi su piattaforme come YouTube e TikTok hanno dimostrato di poter convincere i fan a guardare contenuti, acquistare prodotti e utilizzare diversi servizi, e i loro avatar AI potrebbero avere lo stesso impatto.

 https://www.theinformation.com/articles/meta-is-paying-creators-millions-for-ai-chatbots

 L’acquisizione di Activision Blizzard è giunta al termine?

Microsoft prevede di completare l’acquisizione da 68,7 miliardi di dollari di Activision Blizzard la prossima settimana, ha riferito The Verge.

L’azienda prevede che venerdì 13 ottobre sarà la scadenza entro la quale Microsoft annuncerà al mondo che il processo di 20 mesi per acquisire Activision Blizzard è terminato, hanno detto fonti.

Tuttavia, se Microsoft riuscirà ad annunciare questa notizia come previsto per allora, dipenderà anche dall’autorità di regolamentazione antitrust britannica “Competition and Markets Authority” (CMA). Microsoft e Activision Blizzard hanno recentemente prorogato la scadenza della transazione al 18 ottobre in attesa dell’esito dei negoziati con le autorità di regolamentazione britanniche.

Microsoft ha ricevuto l’approvazione preliminare dalla CMA il mese scorso dopo che Activision Blizzard ha accettato di vendere i suoi diritti di streaming a Ubisoft Entertainment. Se Microsoft riuscisse ad acquisire Activision Blizzard, segnerebbe l’accordo più grande nel settore dei giochi.

 https://www.theverge.com/2023/10/6/23905946/microsoft-activision-blizzard-deal-finalization-timing-cma

 La classifica Forbes 400 negli Stati Uniti ha annunciato che Musk si è classificato al primo posto

Recentemente, negli Stati Uniti, “Forbes” ha pubblicato la classifica “Forbes 400” dei super ricchi negli Stati Uniti.

Nel complesso, la ricchezza delle 400 persone più ricche degli Stati Uniti ha raggiunto un totale di 4,5 trilioni di dollari (circa 32,38 trilioni di RMB), eguagliando il record di ricchezza stabilito nel 2021.

Secondo Forbes, grazie al boom guidato dall’intelligenza artificiale e dalla tecnologia e alla ripresa del mercato azionario, la ricchezza di questi ricchi è aumentata di circa 500 miliardi di dollari rispetto all’anno precedente.

La classifica della ricchezza dei primi 8 ricchi è la seguente

È interessante notare che la barriera d’ingresso per questa “Forbes 400” non è bassa: il patrimonio netto deve raggiungere almeno 2,9 miliardi di dollari, rispetto a soli 2,7 miliardi di dollari l’anno precedente.

Secondo Forbes, la leggendaria star americana Michael Jordan è diventato il primo giocatore professionista a comparire nella lista grazie al suo accordo con Nike e alla vendita della sua partecipazione nell’atleta degli Charlotte Hornets.

Altri miliardari troppo poveri per entrare nella lista includono il CEO di Apple Cook (1,8 miliardi di dollari), il COO di Facebook Sandberg (1,8 miliardi di dollari) e l’ex presidente degli Stati Uniti Trump (2,6 miliardi di dollari).

 https://www.forbes.com/forbes-400/

 Stanno per essere annunciati i Premi Nobel 2023

Durante la festa nazionale, oltre ai Giochi asiatici di Hangzhou che hanno dominato lo schermo, attira l’attenzione anche “chi vincerà il Premio Nobel” nel 2023.

I premi finora annunciati sono:

Il Premio Nobel per la Fisica viene assegnato a Pierre Agostini, Ferenc Krausz e Anne L’Huillier “per le loro ricerche. Per i loro contributi ai metodi sperimentali per la generazione di laser ad attosecondi grazie alla dinamica degli elettroni nella materia.

Il Premio Nobel per la Fisiologia e la Medicina è stato assegnato alla scienziata ungherese Katalin Karikó e allo scienziato americano Drew Weissman per le loro scoperte sulla modificazione delle basi nucleosidiche.

Il Premio Nobel per la letteratura viene assegnato allo scrittore e drammaturgo norvegese Jon Fosse per le sue opere e saggi innovativi che danno voce all’ineffabile.

Inoltre verranno annunciati numerosi premi come il Premio Nobel per la pace. Vale la pena notare che quest’anno il premio in denaro per ciascun Premio Nobel sarà aumentato di 1 milione di corone svedesi (circa 650.000 RMB), raggiungendo 11 milioni di corone svedesi (circa 7,15 milioni di RMB), il livello più alto della storia.

 https://www.nobelprize.org/prizes/about/prize-announcement-dates/

Caccia agli strumenti|Strumenti avanzati

 Assistente con Bard: il tuo assistente AI

Di recente, alla conferenza Made by Google 2023, Google ha lanciato Assistant with Bard.

Assistant with Bard è un assistente personale basato sull’intelligenza artificiale generativa che combina le capacità di ragionamento generativo del chatbot Bard con le capacità di assistenza personalizzata dell’Assistente.

Lo strumento si integrerà con le app Google come Gmail e Documenti, così potrai parlare facilmente con un Assistente Google e farti aiutare a fare cose come creare didascalie per le foto, creare liste della spesa e trovare informazioni nella tua casella di posta elettronica. .

Google promette che Assistant with Bard verrà gradualmente spinto su iOS e Android nei prossimi mesi, per informazioni più specifiche potete fare riferimento al precedente articolo di APPSO.

La serie Pixel 8 è ufficialmente rilasciata! Questa è la funzionalità killer dell’intelligenza artificiale di Google

 https://www.cnet.com/tech/services-and-software/google-assistant-with-bard-puts-an-ai-chatbot-in-your-iphone-or-android/#ftag=CAD590a51e

 L’intelligenza artificiale impiega solo 26 secondi per progettare un robot

Recentemente, un team guidato da ricercatori della Northwestern University ha sviluppato la prima intelligenza artificiale in grado di progettare autonomamente robot.

La natura ha impiegato miliardi di anni per far evolvere le prime specie che camminano, ma questa intelligenza artificiale è stata in grado di progettare un robot ambulante di successo in soli 26 secondi.

“Abbiamo scoperto un algoritmo di progettazione molto veloce basato sull’intelligenza artificiale che aggira le deviazioni evolutive e non si basa sui pregiudizi umani”, ha affermato Sam Kriegman, ricercatore della Northwestern University.

I ricercatori hanno dato all’intelligenza artificiale un suggerimento di base: “Progetta un robot che possa camminare su una superficie piana”. In un batter d’occhio, l’intelligenza artificiale potrebbe costruire un progetto di base.

L’intelligenza artificiale inizia con un pezzo di materiale delle dimensioni di un sapone, che all’inizio si limita a tremare ed è completamente incapace di camminare. L’intelligenza artificiale valuta quindi l’efficacia del suo design e itera rapidamente sul progetto.

Infine, il robot può rimbalzare sul posto, poi saltare e andare avanti. Dopo nove tentativi, l’intelligenza artificiale ha progettato un robot in grado di camminare ogni secondo, a circa la metà del ritmo di un essere umano.

 https://news.northwestern.edu/stories/2023/10/instant-evolution-ai-designs-new-robot-from-scratch-in-seconds/

 Amazon prevede di lanciare un chatbot AI

Amazon sta rinnovando l’esperienza di ricerca sul suo sito Web e sulle sue app per incorporare funzionalità di intelligenza artificiale generativa che sono più conversazionali, più profonde e più personalizzate, ha riferito BusinessInsider.

Il progetto, nome in codice “Project Nile”, mira ad aggiungere funzionalità di intelligenza artificiale alla barra di ricerca esistente di Amazon per consentire confronti istantanei di prodotti, ottenere maggiori dettagli e recensioni sui prodotti e fornire consigli basati sui contenuti di ricerca degli utenti e sui dati di acquisto personali.

Persone a conoscenza della questione hanno affermato che il lancio della nuova ricerca era originariamente previsto per settembre di quest’anno, ma ora è stato posticipato a circa gennaio del prossimo anno e sarà lanciato prima sul mercato statunitense.

La ricerca interattiva basata sull’intelligenza artificiale potrebbe migliorare l’esperienza di acquisto su Amazon. Inoltre, Amazon spera che i cambiamenti aumentino le vendite, soprattutto sui dispositivi mobili.

A caccia di intuizioni|Profeta

 Masayoshi Son, CEO di SoftBank: L’intelligenza artificiale generale supererà l’intelligenza umana entro dieci anni

Il CEO di SoftBank, Masayoshi Son, è recentemente intervenuto pubblicamente alla conferenza aziendale SoftBank World 2023 a Tokyo.

Durante l’incontro, Masayoshi Son ha dichiarato: “L’intelligenza artificiale generale supererà l’intelligenza totale umana 10 volte in 10 anni”.

▲ Immagine da: Reuters

Egli ritiene che l’intelligenza artificiale generale influenzerà vari settori, dai trasporti e i prodotti farmaceutici alla finanza, produzione, logistica, ecc., e che le aziende e gli individui che lavorano sull’intelligenza artificiale diventeranno leader nei prossimi 10-20 anni.

“Sarebbe triste restare sul lato abbandonato, come una vecchia strada commerciale chiusa.” Per questo Masayoshi Son ha invitato le aziende giapponesi a “svegliarsi” in tempo alla visione dell’intelligenza artificiale che guida il futuro. .

Ma ha anche sottolineato la necessità di affrontare le preoccupazioni relative alla disinformazione e ai rischi legati alla privacy e al diritto d’autore, e di non esitare a preoccuparsi delle violazioni dei dati e di altri possibili rischi.

https://www.euronews.com/next/2023/10/05/ai-will-surpass-human-intelligence-in-a-decade-says-japans-leading-businessman

 Jamie Dimon, CEO di JPMorgan Chase: Si prevede che l’intelligenza artificiale eliminerà la settimana lavorativa di 5 giorni

Jamie Dimon, CEO di JPMorgan Chase, ha recentemente accettato un’intervista con Bloomberg TV. Nell’intervista, ha affermato che JPMorgan Chase & Co. sta abbracciando l’intelligenza artificiale e che la tecnologia ha la capacità di migliorare significativamente la qualità della vita dei suoi dipendenti.

▲ Immagine da: Getty Images

“Grazie ai progressi della tecnologia, i vostri figli vivranno fino a 100 anni e non si ammaleranno di cancro”, ha detto ai giornalisti Jamie Dimon, “potrebbero letteralmente lavorare tre giorni e mezzo alla settimana”.

Secondo Bloomberg, i dati della società di consulenza Evident hanno mostrato che JPMorgan Chase ha assunto più di 3.500 posizioni legate all’intelligenza artificiale tra febbraio e aprile.

Jamie Dimon ha affermato che l’intelligenza artificiale è “reale” e “fondamentale” per il futuro successo di JPMorgan Chase, poiché aiuta a migliorare la produttività, la progettazione del prodotto, il coinvolgimento dei clienti e la gestione del rischio.

 https://www.entrepreneur.com/business-news/jpmorgans-jamie-dimon-says-ai-leads-to-35-day-work-week/463069

 L’intelligenza artificiale potrebbe fornire 10 trilioni di dollari in guadagni di produttività

Il CEO e presidente di IBM Arvind Krishna ha recentemente dichiarato al World Government Summit di Dubai: “Nei prossimi 10 anni, l’intelligenza artificiale porterà un contributo di 10 trilioni di dollari all’economia globale”.

Crede che l’intelligenza artificiale abbia il potenziale per cambiare l’economia mondiale grazie all’aumento della produttività pro capite.

“Se si pensa alla crescita del Pil, potrebbe essere tra il 10%, il 20% o il 30%. Ma dobbiamo stare attenti, dobbiamo sfruttare le competenze e impiegarle nel modo giusto.”

In una conversazione con il funzionario degli Emirati Arabi Uniti Omar bin Sultan Al Olama, Arvind Krishna ha affermato che una maggiore adozione dell’intelligenza artificiale nei soli Emirati Arabi Uniti potrebbe portare a guadagni di produttività fino a 200 miliardi di dollari entro il 2030.

 https://www.cnbc.com/video/2023/10/02/10-trillion-dollars-of-productivity-to-be-reaped-from-ai-says-ibm.html

Caccia al divertimento|Prima di tutto

 Strumento di traduzione di immagini di fumetti

Se sei un appassionato di fumetti senior, potresti essere infastidito perché non puoi leggere fumetti in lingua straniera e non sembra conveniente imparare temporaneamente una lingua. L’artefatto di traduzione dell’intelligenza artificiale dei fumetti che presenterò di seguito potrebbe aiutarti a risolvere questo problema.

Manga-Image-Translator è un traduttore di immagini di fumetti open source in grado di tradurre automaticamente il testo in immagini di fumetti. Naturalmente è possibile utilizzare anche immagini normali. Una volta completata la traduzione, la traduzione verrà sostituita nella posizione originale dell’immagine.

Attualmente questo strumento supporta principalmente giapponese, cinese, inglese e cinese. La velocità di traduzione è abbastanza elevata e l’effetto non è male.

Link per la prova dello strumento: https://cotrans.touhou.ai/

 https://twitter.com/xiaohuggg/status/1710264008140619781

È il momento delle uova di Pasqua

Per celebrare il suo cinquantesimo anniversario, 10 iconici architetti hanno utilizzato l’intelligenza artificiale per ridisegnare la Sydney Opera House. Quale versione preferisci?

# Benvenuti a seguire l’account pubblico WeChat ufficiale di aifaner: aifaner (ID WeChat: ifanr). Contenuti più interessanti ti verranno forniti il ​​prima possibile.

Ai Faner | Link originale · Visualizza commenti · Sina Weibo