Honor 600 punterà a migliorare l’IA generativa nei video

honor 600
  • Honor presenterà la serie 600 il 23 aprile con il nuovo sistema Image to Video 2.0, un modello multimodale che genera video direttamente sul dispositivo partendo da immagini e comandi testuali in linguaggio naturale.
  • La funzione permette di creare video dai 3 agli 8 secondi combinando fino a tre immagini di riferimento, con accesso tramite pulsante AI dedicato e template predefiniti che includono effetti cinematografici come lo zoom Hitchcock e il Bullet time.
  • Honor ha affrontato il problema della coerenza visiva tramite una funzione di costruzione multi-angolo del soggetto, garantendo continuità anche con movimenti di camera complessi.

La capacità di trasformare le immagini statiche in brevi sequenze video animate attraverso l’intelligenza artificiale non è una novità assoluta nel mondo degli smartphone. Honor aveva già introdotto questa funzionalità con la serie 400 lo scorso anno, riscuotendo un discreto successo tra gli utenti. Ora l’azienda si prepara a compiere un passo avanti significativo con il lancio della serie Honor 600, previsto per il 23 aprile.

I numeri della prima versione dello strumento sono interessanti: dall’introduzione della funzione Image to Video, gli utenti hanno generato complessivamente oltre 13,4 milioni di secondi di contenuti video tramite intelligenza artificiale. Si tratta di una mole di materiale che richiederebbe circa 155 giorni di visione continua per essere visionata interamente.

Un modello multimodale integrato nel dispositivo

La vera novità della serie Honor 600 risiede nell’implementazione di quello che l’azienda definisce come il primo modello multimodale unificato per la generazione video che opera completamente sul dispositivo. Questo significa che il sistema non solo è in grado di creare video partendo da immagini, ma può anche modificarli seguendo istruzioni impartite attraverso il linguaggio naturale.

Il termine multimodale indica la capacità del sistema di accettare diversi tipi di input: immagini, video e testo. L’utente può fornire da una a tre immagini di riferimento e descrivere a parole cosa desidera ottenere, specificando anche azioni precise che dovranno comparire sullo schermo. Il risultato finale sarà un video della durata compresa tra 3 e 8 secondi.

Controllo creativo e template predefiniti

L’approccio proposto da Honor con la versione 2.0 dello strumento punta a offrire un elevato grado di controllo. È possibile, per esempio, fornire al sistema un’immagine iniziale e una finale, lasciando che l’intelligenza artificiale riempia gli spazi intermedi seguendo le indicazioni testuali fornite. Chi preferisce sperimentare senza partire da zero può affidarsi ai template predefiniti, che includono tecniche cinematografiche riconoscibili come lo zoom Hitchcock, il Bullet time e altri effetti di trasformazione scenica.

Una delle sfide tradizionali dei sistemi di generazione video tramite AI riguarda la coerenza visiva. Avendo a disposizione solo poche immagini statiche, il modello non può osservare gli oggetti da tutte le angolazioni, il che può causare distorsioni quando tenta di rappresentarli da prospettive inedite. Honor dichiara di aver affrontato questo limite attraverso una funzione chiamata costruzione multi-angolo del soggetto, pensata per mantenere la continuità visiva anche in presenza di movimenti di camera complessi.

Accesso rapido tramite pulsante dedicato

Per facilitare l’utilizzo della funzione, la serie Honor 600 integrerà un pulsante AI dedicato, pensato per rendere l’accesso immediato sia quando si lavora con foto personali sia quando si vogliono utilizzare immagini viste su piattaforme come Instagram.

La gamma sarà composta da due modelli: Honor 600 e Honor 600 Pro. L’azienda ha già iniziato a diffondere i primi teaser, mostrando il design in colorazione nera e anticipando alcune caratteristiche estetiche della serie.

Fonte