Guelnika, le site d'E-magination
  • J'ai restauré les sons des RTP de RPG Maker 2000 en Haute Définition

    J'ai restauré les sons des RTP de RPG Maker 2000 en Haute Définition

  • Le screen de la semaine

    Le screen de la semaine

  • Fatal Ky: Solaros - Essai avec Unity

    Fatal Ky: Solaros - Essai avec Unity

  • Frost House: Qui a dit que Noël était toujours joyeux ?

    Frost House: Qui a dit que Noël était toujours joyeux ?

  • Le Festival des Couleurs

    Le Festival des Couleurs

 

News

J'ai restauré les sons des RTP de RPG Maker 2000 en Haute Définition

J'ai restauré les sons des RTP de RPG Maker 2000 en Haute Définition

Date : Aujourd'hui
Auteur : AristA
J’ai grandi avec RPG Maker 2003. Aujourd’hui, voyons si on peut restaurer la qualité des effets sonores des RTP grâce à la super-résolution audio.

Qu’est-ce que la super-résolution audio ?

C’est en gros comme de l’upscaling d’image, mais pour le son.


Image illustrative
Original




Image illustrative
Super résolution



Pourquoi c'est difficile ? Vous pouvez agrandir une image dans Paint, mais ça n’ajoute pas magiquement des détails, ça rend juste les pixels grands et flous. C’est la même chose avec l'audio. Convertir simplement un fichier vers un plus gros format ne rajoute pas magiquement des détails. Le but est de reconstruire les détails manquants de manière plausible.

Prenons un exemple : l’effet Sword2.wav d’origine des RTP de RM2k.


Image illustrative



Cette image est un spectrogramme : il affiche les fréquences du son (graves, aigus) au fil du temps. Les zones claires correspondent aux fréquences et aux moments les plus forts.


Le son original semble tout droit sorti d'une cassette d’un film de karaté des années 1980. C'est parce que les RTP sont encodés en .WAV, certes, mais à 22.05 kHz et 16 bits pour économiser de l'espace disque. Ca veut dire que les fréquences encodées ne vont que jusqu'à 10kHZ, alors que l'oreille humaine entend jusqu'à environ 20 kHz.

Maintenant, voici la version restaurée, traitée avec UniverSR sur Neural Analog :


Image illustrative



Regardez le spectrogramme : cette fois, l’échelle va jusqu’à 24 kHz. Le nouvel audio est en 48 kHz, 24 bits. C'est mieux qua la qualité CD ! À l’écoute, le son est plus brillant.

Le son n’est pas juste plus fort, égalisé différemment, ou avec de reverb. Le spectrogramme montre des fréquences manquantes reconstruites de façon logique, comme si l’on avait demandé à quelqu’un de « repeindre » les détails perdus.


Voilà. C'est ça la restauration audio. Et en gros j'ai fait ça pour tous les effets sonores des RTP.

Télécharger tous les effets sonores restaurés de RPG Maker 2000 RTP



J’ai traité les 203 effets sonores du RTP de RPG Maker 2000 pour les convertir en versions haute qualité en 48 kHz.

Télécharger tous les sons restaurés

Plus d'exemples



La différence s'entend mieux avec un casque!

Jump1.wav

Original

Restauré


Bite.wav

Original

Restauré


Bell.wav

Original

Restauré


Explosion2.wav

Original

Restauré


Sheep.wav

Original

Restauré


Comment ça marche? Le modèle de restauration UniverSR



Alors, je n’ai pas retrouvé les versions originales en haute qualité de ces fichiers. J’ai juste utilisé un modèle de machine learning.

UniverSR est un modèle de super-résolution audio développé par l’Université de Séoul en 2026. Il prend en entrée un audio de faible qualité et reconstruit une version de meilleure qualité du même son.

Pour expliquer UniverSR simplement, l’audio est d’abord transformé en image (le spectrogramme). Ensuite, le modèle reconstruit les détails à l’aide du flow matching, la même technique que pour la génération d’images IA super réalistes (comme Nano Banana ou Midjourney). Enfin, le spectrogramme est reconverti en audio.

UniverSR a été entraîné avec des données audio libres de droits (voix, musique et effets sonores). Ces audios sont dégradés afin de créer des paires d’entraînement. Le modèle regarde la version basse résolution et imagine à quoi devrait ressembler une version haute résolution.

Comment restaurer des sons avec UniverSR ?



UniverSR est open source, mais il demande quelques connaissances techniques et un GPU puissant. J’ai pu le faire tourner sur Neural Analog qui rend l'importation et le processing très simple (configuration : modèle universr-audio, mono, préréglage 4 kHz vers 24 kHz).

Le traitement a pris environ 20 minutes pour l’ensemble du pack. Ce modèle n’est pas le plus rapide, mais les résultats étaient meilleurs que les autres options automatiques que j’ai testées (AudioSR). Peut-être on peut encore améliorer les résultats avec d'autres préréglages ou retouches manuelles...

Voici à nouveau le lien de téléchargement : Télécharger l’archive restaurée RPGRT

Si vous participez à une game jam, ou si vous êtes juste nostalgiques, j’espère que ça vous sera utile !

Plus d'infos Trobien ! (0)

Commentaires

Écrire un commentaire

Pour pouvoir poster un commentaire, vous devez être connecté sur votre compte. Si vous n'avez pas de compte, vous pouvez en créer un très rapidement.