Intervista esclusiva con il team di ottimizzazione Vivo TWS 5 Hi-Fi Edition: portare la sinfonia più autentica “dal vivo” al pubblico

"Le persone sopravvalutano sempre i cambiamenti nei prossimi 1-2 anni, ma sottovalutano quelli nei prossimi 10 anni". Le parole di Bill Gates hanno una versione più concreta. Yu Yang, professore e preside del Dipartimento di Ingegneria Musicale del Conservatorio di Musica di Shanghai, direttore dello Shanghai Key Laboratory of Music Acoustics e compositore, ha commentato la versione Hi-Fi del vivo TWS 5:
Se questo visore vivo fosse stato venduto dieci anni fa, non so a quale prezzo sarebbe stato venduto.
Naturalmente, con le capacità tecnologiche di 10 anni fa, nessun produttore avrebbe osato affermare di essere in grado di creare un auricolare Bluetooth wireless Hi-Fi con riduzione del rumore di 60 dB e trasmissione full-link lossless. Il professor Yu Yang sostiene che, sebbene gli auricolari Hi-Fi vivo TWS 5 da 499 yuan non siano costosi solo in termini di qualità del suono, portano la qualità audio e l'estetica della musica portatile sui telefoni cellulari a un livello inimmaginabile 10 anni fa.

Per restaurare la sinfonia più difficile
Quando si tratta di accordare un paio di cuffie, evidenziare le note alte, forti e chiare o i bassi da batticuore sono metodi più ovvi ed efficaci. Anche le persone più ottuse percepiranno la stimolazione uditiva diretta in alcune canzoni familiari da audizione.
Ma la versione Hi-Fi del vivo TWS 5 ha scelto un'altra strada: il vivo Golden Ear Acoustic Laboratory e il team di esperti di accordatura del Conservatorio di Musica di Shanghai hanno lavorato insieme per ottimizzare la qualità del suono, decostruendo le caratteristiche di risonanza dei 32 strumenti della sinfonia e creando congiuntamente l'effetto sonoro "Ultimate Master".

Sebbene le parole non siano mai sufficienti a descrivere il suono e poche persone possano scrivere una frase come "una bottiglia d'argento si rompe all'improvviso e l'acqua schizza, la cavalleria di ferro si precipita fuori e risuonano spade e pistole", vivo fa comunque del suo meglio per descrivere l'esperienza d'ascolto del "Master of Sound" come segue:
Lasciate che la cavità lignea del violoncello respiri accanto alle vostre orecchie e l'attrito metallico della tromba si trasformi nel fruscio della foglia d'oro. Allo stesso tempo, il codice acustico della Sala d'Oro di Vienna è codificato nella microcavità, permettendo alle sottili pennellate di Brahms e Debussy di essere catturate vividamente in questo spazio minuscolo. Non sono solo note; è il dialogo più autentico tra strumenti e aria.
Un ingegnere acustico del Golden Ear Acoustic Laboratory di vivo ha dichiarato a iFanr:
Le sinfonie rappresentano una sfida estremamente impegnativa per i sistemi acustici delle cuffie. La musica vocale popolare enfatizza tipicamente melodia e ritmo, e la strumentazione si basa solitamente su una configurazione a quattro elementi. Le sinfonie, d'altra parte, richiedono ritmi, melodie, timbri e armonie complessi. La musica stessa presenta una strumentazione complessa, ampie dinamiche, un'ampia gamma sonora e un palcoscenico sonoro ampio e profondo. Queste caratteristiche sono difficili da ottenere con le cuffie TWS.
In altre parole, rispetto alla musica pop con voci e un piccolo accompagnamento strumentale, la complessità della sinfonia è molto più elevata e l'ampia gamma sonora e il grande campo sonoro rappresentano una grande sfida per le cuffie TWS di piccole dimensioni.
Ha spiegato ulteriormente perché è così difficile riprodurre la sinfonia con le cuffie TWS:
In realtà è difficile e vuoto spiegare l'esperienza uditiva del suono con concetti, perché il suono è essenzialmente una sensazione. Anche se si tratta dello stesso "senso di presenza", l'esperienza interiore di ognuno è diversa.
Sappiamo che "sensazione di ariosità" corrisponde a "chiarezza e risoluzione". Come possiamo davvero riprodurre attraverso gli altoparlanti la vibrazione dell'aria causata dagli strumenti sul palco? È come se gli strumenti o le voci di un concerto raggiungessero direttamente i nostri timpani solo attraverso la vibrazione dell'aria, e i sottili cambiamenti nelle note alte e basse delle corde potessero essere chiaramente distinti. Questo richiede una maggiore chiarezza e risoluzione in cuffia.
"Atmosfera" corrisponde a "calore e strati". Dal punto di vista della psicologia uditiva, suoni caldi e stratificati possono creare meglio un senso di atmosfera. In generale, richiede frequenze medio-basse corpose e nitide, e frequenze alte, medie e basse distribuite uniformemente e collegate in modo fluido.
Come descritto sopra, "il dialogo più autentico tra strumenti musicali e aria" è in realtà l'incarnazione dell'Hi-Fi.
Restaurare una sinfonia è in realtà la prova definitiva dell'Hi-Fi. Un punteggio elevato è quello che riesce a trasmettere la sensazione di essere "immersi e come se si fosse lì", perché la partitura completa è "davvero lì".

Il team di esperti di accordatura del Conservatorio di Musica di Shanghai che ha collaborato con il Laboratorio Acustico vivo Golden Ear per l'accordatura della qualità del suono includeva Yu Yang, professore e direttore del Dipartimento di Ingegneria Musicale del Conservatorio di Musica di Shanghai, Liu Hao, professore, supervisore di dottorato, direttore del Laboratorio Chiave di Musicoterapia con Intelligenza Artificiale, direttore del Dipartimento di Musica Etnica, compositore e fagottista del Conservatorio di Musica di Shanghai, Qin Shile, professore del Dipartimento di Ingegneria Musicale, direttore della Sezione di Insegnamento e Ricerca di Progettazione e Produzione Musicale, Chen Shizhe, professore associato del Dipartimento di Ingegneria Musicale, direttore della Sezione di Insegnamento e Ricerca di Tecnologia Musicale e Arte, e accordatore del suono di primo livello, e Wang Xin, ingegnere del suono, ingegnere del suono di primo livello e accordatore del suono di primo livello della Shanghai Symphony Orchestra. Si tratta di un team completo impegnato nella musica sinfonica, dalla composizione all'esecuzione, alla registrazione e all'accordatura. Alla domanda su quale fosse il loro modo preferito di ascoltare le sinfonie, le loro risposte sono state esattamente le stesse:
Andate sulla scena.
Pertanto, "restaurare la sinfonia più difficile" è diventato un compito che ha richiesto al team acustico vivo e al team di maestri accordatori del Conservatorio di musica di Shanghai di dimostrare i rispettivi punti di forza e di comprendersi a vicenda.
Ciò richiede non solo la creazione di una struttura acustica più sofisticata all'interno della piccola cavità delle cuffie TWS, ma anche il potenziamento della vera Hi-Fi wireless, dalla trasmissione del segnale alla decodifica audio, fino alle prestazioni full-link wireless di vera Hi-Fi offerte dall'unità acustica. Richiede inoltre una profonda comprensione dell'arte della sinfonia e una migliore capacità estetica.

Le versioni vivo TWS 5 e vivo TWS 5 Hi-Fi utilizzano il diaframma acustico in tungsteno ceramico di seconda generazione, un componente fondamentale del sistema acustico. Il diaframma converte i segnali elettrici ricevuti in vibrazioni fisiche, che a loro volta mettono in movimento l'aria e la trasmettono al timpano, producendo il suono che sentiamo. Il diaframma acustico in tungsteno ceramico di seconda generazione, grazie al suo quadruplo nanorivestimento, offre elevata rigidità ed elasticità, con conseguente risoluzione, risposta ai transienti e dinamica eccezionali. Con una risposta in frequenza di 16 Hz-48 kHz, è in grado di catturare al meglio i dettagli sonori, migliorando la purezza del suono e l'espressione dinamica.
La versione Hi-Fi del vivo TWS 5 è il primo auricolare sulla piattaforma Dimensity a supportare la trasmissione audio senza perdita di dati e può supportare una velocità di trasmissione audio wireless di 1,4 Mbps.
Questa è una linea, perché il bit rate della qualità audio CD (16 bit/44,1 kHz) è di 1,4 Mbps. La versione Hi-Fi di vivo TWS 5 supporta il protocollo di trasmissione ultra-clear LHDC 5.0 e, per la prima volta sulla piattaforma Dimensity, supporta la trasmissione audio wireless lossless LHDC. Sebbene la velocità di trasmissione raggiunga 1,4 Mbps, può offrire un'esperienza audio lossless a 48 kHz/16 bit superiore.
Sulla base di questa solida base tecnica, il team di maestri accordatori del Conservatorio di Musica di Shanghai ha sfruttato i propri punti di forza.
Quando si tratta di accordatura dettagliata, la musica per archi, in quanto fondamento della sinfonia, è una vasta famiglia di strumenti, che copre l'intera gamma di frequenze dal violino al basso, e vanta ricchi armonici. Questo è esattamente ciò su cui si sono concentrati il vivo Golden Ear Acoustic Laboratory e il team di maestri accordatori del Conservatorio di Musica di Shanghai. Il loro primo compito è stato quello di mettere a punto i dettagli della sezione degli archi. Oltre a questo, hanno affrontato le sfide dell'accordatura degli strumenti caratteristici, in particolare ottoni e percussioni, che sono difficili da accordare. Poiché i timbri di questi strumenti sono difficili da catturare con precisione, il team di accordatura della qualità del suono ha dovuto testare ripetutamente la formula timbrica ottimale, proprio come mescolare i colori su una tavolozza di pittura a olio, per garantire il ripristino preciso della consistenza e della profondità di ogni nota.

C'è anche una parte più importante, che riguarda l'estetica musicale, o estetica dell'ascolto.
Il professor Yu Yang del Tuning Master Group del Conservatorio di Musica di Shanghai ha dichiarato a iFanr:
Nel regolare la qualità del suono di queste cuffie, abbiamo principalmente migliorato la tonalità estetica dell'udito e la definizione della qualità del suono.
I prodotti creati esclusivamente grazie ai progressi tecnologici sono spesso basati sui dati, oggettivi e basati su parametri, ma non necessariamente offrono un suono eccezionale. Ad esempio, un pianoforte ha centinaia di corde e 88 tasti. Se fosse accordato interamente a macchina, potrebbe essere accordato con incredibile precisione, fino all'ultimo millimetro, ma il risultato non sarebbe necessariamente piacevole. Il nostro team si è concentrato sull'integrazione di standard estetici acustici relativamente soggettivi, ma universali, con l'hardware oggettivo di queste cuffie, ottenendo una vestibilità armoniosa e consentendo a tutti di sperimentare il significato di un buon suono.

▲ Yu Yang, professore e preside del Dipartimento di Ingegneria Musicale presso il Conservatorio di Musica di Shanghai, ascolta musica
Cos'è un buon suono?
Raggiungere un consenso sulla risposta non è stato facile per entrambe le parti coinvolte. La definizione di buon suono è soggettiva e individuale. Questa volta, il dibattito più acceso tra il team di acustica di vivo e gli esperti di accordatura del Conservatorio di Musica di Shanghai si è concentrato sulla domanda: "Dovremmo assecondare o guidare le preferenze acustiche prevalenti del mercato?"
Se si vuole soddisfare le esigenze del mercato, le frequenze alte e basse saranno deliberatamente esagerate per rendere l'esperienza di ascolto più stimolante.
Se si vuole essere leader di mercato nell'estetica acustica, allora si dovrebbe partire dal senso di equilibrio di una sinfonia.
Il risultato finale è ovviamente già stato reso evidente dalla collaborazione tra le due parti. In definitiva, entrambe vogliono essere leader all'avanguardia nella questione fondamentale di "cos'è un buon suono", che è legata all'essenza della musica.
Tuttavia, il dibattito è sempre in corso e inedito. Come integrare i livelli soggettivo, artistico ed estetico con quelli oggettivo, tecnico e quantitativo per raggiungere uno stato in cui possano essere reciprocamente spiegati e verificati rimane una questione a lungo termine che merita di essere discussa da entrambe le parti.

La "luce" e il "calore" della tecnologia
A volte la tecnologia è come un falò. Quando ci si avvicina, si percepiscono le radiazioni e il calore della tecnologia, e si percepisce il tepore.
La riduzione del rumore è una caratteristica tecnica che gli utenti possono percepire chiaramente.
Le versioni vivo TWS 5 e vivo TWS 5 Hi-Fi offrono una riduzione del rumore fino a 60 dB e una larghezza di banda di 5500 Hz. Come accennato in precedenza, la qualità del suono, l'hardware potente e le specifiche all'avanguardia dipendono in ultima analisi da scenari specifici.
Vivo Golden Ear Acoustic Laboratory ha dichiarato a iFanr:
La nostra ricerca ha rilevato che gli scenari principali per l'utilizzo delle cuffie da parte degli utenti sono principalmente quelli quotidiani, come a casa, durante gli spostamenti casa-lavoro e durante le passeggiate in strada. In particolare, il rumore durante gli spostamenti casa-lavoro e i viaggi di lavoro è relativamente forte e le problematiche riscontrate dagli utenti non sono state ancora risolte. Pertanto, abbiamo condotto una raccolta e un'analisi specifiche del rumore per questi scenari ad alto rumore e abbiamo finalmente messo a punto il nostro effetto di riduzione del rumore più soddisfacente.
La profondità è uno degli indicatori che rappresenta l'effetto di riduzione del rumore, ma non significa che questa profondità debba essere raggiunta in tutte le scene. Per ottenere l'effetto migliore, regoliamo specificamente la curva di riduzione del rumore come supplemento per queste scene.
Proprio come le immagini scattate con i cellulari, molti anni fa, la fotografia era relativamente semplice. Ad esempio, i ritratti richiedevano una forte sfocatura dello sfondo, la pelle doveva essere levigata per sembrare un uovo sbucciato e le scene notturne dovevano essere luminose come il giorno. Ora, il livello estetico delle immagini scattate con i cellulari è stato notevolmente migliorato. I ritratti devono trasmettere un senso di vitalità, pieno di sangue, e le scene notturne devono avere un chiaroscuro ben bilanciato, con un senso di profondità tipico della notte.
La riduzione del rumore negli auricolari TWS non consiste solo nel raggiungere il massimo livello di riduzione del rumore. Esagerare, indipendentemente dallo scenario specifico, non è confortevole. Per questo motivo, vivo ha ottimizzato vivo TWS 5 e vivo TWS 5 Hi-Fi per tre tipici scenari di trasporto: aerei, metropolitana e autobus. Ad esempio, il suono più forte e fastidioso sugli aerei è il rumore del motore a bassa frequenza. Pertanto, in modalità di riduzione del rumore "Aereo", il rumore a bassa frequenza viene soppresso e potenziato di conseguenza.
Ci sono anche alcuni scenari che meritano maggiore attenzione. Ad esempio, durante le ore più calde del lavoro mattutino o durante un pisolino a mezzogiorno, è possibile attivare la "modalità immersione" per ridurre il rumore e aggiungere un po' di rumore bianco, che può aiutare le persone a concentrarsi di più.

▲ Le versioni vivo TWS 5 e vivo TWS 5 Hi-Fi supportano la schermata pop-up di connessione personalizzata
Esistono molti altri esempi di utilizzo della tecnologia per modificare direttamente l'esperienza sulle versioni vivo TWS 5 e vivo TWS 5 Hi-Fi, come: la modalità di gioco a bassa latenza da 42 ms, che garantisce audio e video quasi sincronizzati nei giochi sparatutto in prima persona; la resistenza alla polvere e all'acqua IP54, che può far fronte all'intrusione di pioggia, sudore e polvere nei giorni di pioggia e durante l'attività fisica; la "traduzione AI" collegata a "vivo Translator" sui telefoni vivo, che svolge un ruolo fondamentale anche nei viaggi all'estero, e così via.
Ma a volte, come un falò, la tecnologia non funziona solo con il calore, ma anche con la luce.
Il professore associato Chen Shizhe del team di esperti di accordatura del Conservatorio di Musica di Shanghai sta esplorando la ricerca su musica e intelligenza artificiale. Ha scoperto che la qualità della musica straniera generata dal loro team utilizzando l'intelligenza artificiale è molto superiore a quella della musica nazionale. Ciò non è dovuto all'algoritmo, ma alla qualità dei dati. La fonte di dati utilizzata per addestrare il modello di grandi dimensioni non è sufficientemente buona e anche la qualità della musica generata sarà inferiore.

▲ Chen Shizhe, professore associato del Dipartimento di Ingegneria Musicale e direttore della Sezione di Ricerca e Insegnamento di Tecnologia Musicale e Arte del Conservatorio di Musica di Shanghai, ascolta musica
Il professore associato Chen Shizhe del team di maestri di accordatura del Conservatorio di musica di Shanghai ha inoltre spiegato a iFanr la logica alla base della decisione finale del Conservatorio di musica di Shanghai di collaborare con vivo:
Gli strumenti di riproduzione utilizzati dai nostri figli durante le lezioni di musica fin dall'infanzia non sono di buona qualità. Si tratta di piccoli altoparlanti economici o di piccoli altoparlanti appesi al muro. In altre parole, sono stati abituati a prestare poca attenzione alla qualità del suono fin dall'infanzia.
Anche quando il karaoke era già popolare, molte opere musicali furono registrate appositamente per gli altoparlanti karaoke, il che creò uno standard. Da un lato, promosse lo sviluppo dell'industria audio e, dall'altro, influenzò anche l'estetica musicale di molte persone.
In passato, i dispositivi di riproduzione che competono in termini di volume e stimolazione sensoriale hanno influenzato profondamente la prospettiva di ascolto di tutti, ma un'estetica musicale migliore e più scientifica deve basarsi su una curva uditiva più bilanciata e precisa, nonché su dispositivi di riproduzione migliori.
Questa è anche l'ultima richiesta dei consumatori per le cuffie. Wang Youfei, direttore generale del reparto sviluppo terminali intelligenti di Vivo, ha dichiarato a iFanr:
Con il miglioramento dell'estetica musicale nell'intera società, la diffusione della musica lossless e l'evoluzione delle tecnologie audio di vari produttori, i consumatori hanno anche avanzato requisiti più elevati per il suono ascoltato in cuffia. I requisiti di qualità del suono sono gradualmente passati da "ascolto del suono" a "restauro del suono originale a livello di studio", e i consumatori sperano di ottenere un'esperienza musicale più immersiva.
Il progresso della tecnologia e dei prodotti, il miglioramento dell'estetica musicale e l'aggiornamento delle esigenze degli utenti sono tre fili intrecciati e il rapporto tra loro sta diventando sempre più stretto.

Secondo il punto di vista sia di vivo che dei Tuning Masters del Conservatorio di Musica di Shanghai, la versione Hi-Fi di vivo TWS 5 punta a diventare un prodotto che unisce passato e futuro.
Da un lato, le sue curve bilanciate e precise, unite alla qualità audio Hi-Fi, rimodellano l'estetica musicale precedentemente accettata, caratterizzata da stimolazioni intense e suoni bassi. Dall'altro, per la creazione musicale nella futura era dell'intelligenza artificiale, il corpus musicale basato sull'intelligenza artificiale richiede musica di elevata qualità sonora ed estetica. Cuffie che presentino accuratamente sia l'estetica che la qualità audio sono la leva per la creazione musicale e il fondamento che determina il livello della nostra abilità musicale nell'era dell'intelligenza artificiale.
La cosa più importante è che, come ha affermato il professor Yu Yang del team di esperti di accordatura del Conservatorio di Musica di Shanghai, il progresso tecnologico ha migliorato l'esperienza utente da un lato e abbassato la soglia di ascolto dall'altro. Un tempo dicevamo che le cuffie servivano "solo per ascoltare il rumore a meno di 10.000 yuan", ma ora vivo può offrire "Hi-Fi a meno di 500 yuan".
Anche la comprensione della musica da parte del vivo Golden Ear Acoustic Laboratory si è arricchita grazie a questa collaborazione. In precedenza, condensavano la loro ricerca sonora in un "suono ad alta risoluzione, chiaro e caldo". Ora, grazie a questa collaborazione, hanno approfondito l'espressione di "aria" e "atmosfera". Questo perché vogliono evidenziare la presenza e il realismo della sinfonia, in modo che il pubblico possa non solo percepire l'accurato restauro delle note, ma anche percepire la risonanza spaziale dell'esecuzione orchestrale, le sottili transizioni timbriche tra gli strumenti e l'atmosfera emotiva contenuta nella musica, compiendo un salto dal "restauro tecnico" all'"espressione artistica".
Proprio come sentiamo spesso parlare della "Sala d'Oro di Vienna", per la maggior parte delle persone questo music hall è un termine astratto, e ascoltare un concerto del Festival di Primavera qui è un concetto vago. Sappiamo tutti che la musica qui è meravigliosa, ma siamo sempre separati da questa bellezza da un velo.
Il lavoro del Golden Ear Acoustic Laboratory di vivo consiste in realtà nel visualizzare il più possibile questa bellezza altamente concettuale e ambigua attraverso i prodotti, completando così un lavoro di educazione estetica.
Questo è il lato "leggero" della tecnologia, morbido ma tangibile.
Sebbene dal punto di vista dell'educazione estetica musicale o del livello della musica nella futura era dell'intelligenza artificiale, sia difficile affermare che prodotti come la versione Hi-Fi del vivo TWS 5 possano avere un impatto diretto e intuitivo nel breve termine, nel lungo periodo e nella lunga catena questi luoghi devono essere illuminati dalla "luce" prima che gradualmente ci rendiamo conto: Oh, sembra che questa sia la direzione in cui dovremmo procedere.
Si tratta di un'impresa che durerà un decennio. Forse tra 10 anni, con l'aiuto di tecnologie avanzate di audio computazionale, audio spaziale e persino di interfacce cervello-computer, saremo in grado di ricreare virtualmente l'emozionante esperienza uditiva di ascoltare una sinfonia nella Sala d'Oro di Vienna sui nostri dispositivi portatili. Tuttavia, non dimentichiamo che il primo passo che facciamo oggi determina dove arriveremo alla fine.
#Benvenuti a seguire l'account pubblico ufficiale WeChat di iFaner: iFaner (ID WeChat: ifanr), dove vi verranno presentati contenuti ancora più interessanti il prima possibile.

