En poursuivant votre navigation, vous acceptez l'utilisation de services tiers pouvant installer des cookies. En savoir plus

Voir les sujets non lus
Marquer tous les sujets comme lus
Accéder aux archives

[Programmation][Musique] Encodeur musical

Ou comment transformer un message en musique

  • 29 sujets
  • 180 réponses

28 févr. 2016 - 21:08

Bien le bonjour !
Alors voila, cela faisait un moment déjà que l'idée me trottait dans la tête et je me décide enfin à me lancer. Comment incorporer dans ma musique des messages plus ou moins cachés, des textes non lus mais qui soient véhiculés par la musique ?

Par exemple comment faire dire à ma musique "Je mange une pomme" ou encore "Je t'aime" sans utiliser de voix, et sans produire de sons directement interprétables comme des voix, tout en permettant de retrouver le message avec un peu d'analyse ?

Pour transmettre un message caché il existe un vaste panel de solutions de cryptographie qui consistent à coder un message dans un texte impossible à lire sans décryptage ou encore dans un signal, et donc qui doit être analysé pour le comprendre. Je me suis dit pourquoi ne pas utiliser la musique comme vecteur de cryptographie ? Les notes et leurs représentations sont déjà en quelque sorte une forme de codification, de langue à part dans les modes d'expression humains, alors utilisons les pour parler et communiquer !


Je vous propose dans ce sujet de vous montrer les étapes de ma réflexion autours de cette problématique et des trucs et bidules que je pourrai réaliser autours de ça. Pour les très curieux impatients, il y a de l'audio à la fin si vous voulez vous spoiler le résultat ;)


Un programme pour transformer un texte en notes

Ce que je souhaite c'est à partir d'un texte en entrée, avoir en sortie de mon programme un ensemble de notes qui soient la traduction de ce texte, et que je puisse ensuite de cette partition retrouver le texte d'origine en suivant le processus inverse.

Mais comme je parlais précédemment de musique, un ensemble de conditions sont à remplir pour que la musique soit écoutable comme l'harmonie du morceau (ne pas avoir des notes qui ne vont pas ensemble en même temps) et le rythme qui doit être à une vitesse agréable.

Si je fais une traduction bête et méchante de chaque lettre de mon texte en note, j'ai un gros risque que mon morceau ne soit pas beau car d'apparence aléatoire et chaotique.

1. La notion de gamme

Ainsi vient ma première contrainte : restreindre les notes possibles à un ensemble cohérent, une gamme. Une gamme est un ensemble de 7 notes (le plus souvent) qui propose un panel de fréquences qui sonnent "bien" quand elles sont joué à la suite ou simultanément. Une gamme est construite comme suit :
- Une note fondamentale qui donne son nom à la gamme
- Des intervalles qui donnent sa couleur à la gamme

Par exemple la gamme de Do Majeur est la suivante :
- Fondamentale : Do
- Intervalles : 1 1 0.5 1 1 1 -> Majeur

Pour déterminer les notes de la gamme de Do Majeur il suffit alors de calculer les notes qui suivent sa fondamentale (Do) en fonction des intervalles et des notes existantes.
L'ensemble des douze notes existantes dans notre musique occidentale "classique" est : DO DO# RE RE# MI FA FA# SOL SOL# LA LA# SI
Chaque note est espacée de ce que l'on appelle un demi-ton, ainsi entre DO et DO# il y a un demi-ton, entre DO et RE il y en a deux soit un ton, entre DO et RE# il y a trois demi-tons ... etc

Pour en revenir à notre gamme, nous avons vu que ses intervalles sont "1 1 0.5 1 1 1", et magie, ce sont en réalité des tons demi-tons, ainsi ici "ton ton demi-ton ton ton ton" ça veux dire que la deuxième note de la gamme est égale à la note fondamentale plus un ton, la troisième vaut la deuxième plus un ton, la quatrième vaut la troisième plus un demi-ton etc ...

Toutes les notes : DODO#RERE#MIFAFA#SOLSOL#LALA#SI
Gamme : DOREMIFASOLLASI

Ainsi la gamme de Do Majeur est : DO RE MI FA SOL LA SI

Si on avait voulu la gamme de FA majeur on aurait fait :
- Fondamentale : Fa
- Intervalles : 1 1 0.5 1 1 1 -> Majeur

Toutes les notes : FAFA#SOLSOL#LALA#SIDODO#RERE#MI
Gamme : FASOLLALA#DOREMI

Ainsi la gamme de Fa Majeur est : FA SOL LA LA# DO RE MI

Et pour une gamme de Do Mineur cette fois :
- Fondamentale : Do
- Intervalles : 1 0.5 1 1 0.5 1 -> Majeur

Toutes les notes : DODO#RERE#MIFAFA#SOLSOL#LALA#SI
Gamme : DORERE#FASOLSOL#LA#

Ainsi la gamme de Do Majeur est : DO RE RE# FA SOL SOL# LA#

Les notes la gamme ont chacune leur nom, en fonction de leur position, comme ici avec la gamme de Do Majeur :
Note : DOREMIFASOLLASI
Nom : FondamentaleSecondeTierceQuarteQuinteSixteSeptième

Les noms sont logiques.

2. Coder un caractère

Je propose de coder chaque caractère de notre texte en un couple de deux notes, un intervalle, contenues dans la gamme, une note dans une octave grave et une autre aigue, ainsi par exemple on peut dire que le caractère 'a' = DO grave + DO aigu, puis 'b' = DO grave + RE aigu ... etc, ainsi avec deux octave de 7 notes nous sommes capables de coder 7x7 caractères, soit 49.

Mais il y a une chose importante à savoir, c'est que toutes les notes de la gamme ne sonnent pas toutes aussi bien ensemble, d'abord pour des raison mathématiques mais aussi purement subjective propre à chacun. De manière générale les notes qui vont le mieux ensemble sont la fondamentale et la tierce, la fondamentale et la quinte, la fondamentale et la septième ... etc.
Ainsi arbitrairement je défini une échelle du plus "harmonieux" au plus "dissonnant" :
- Fondamentale et fondamentale = unison (l'intervale le plus "parfait" en musique)
- Fondamentale et Tierce = premier intervalle d'un accord "parfait"
- Fondamentale et Quinte = second intervalle d'un accord "parfait"
- Fondamentale et Septième = troisième intervalle d'un accord "de septième"
- Fondamentale et Sixte
- Fondamentale et Quarte
- Fondamentale et Seconde

Ainsi plus dans mon message il y aura de caractères traduits par des intervalles du haut de cette liste plus la musique sera harmonieuse, et plus il y en aura de la fin plus elle sera dissonnante voir désagréable.
Donc pour que mes messages soient le plus souvent harmonieux il faut que je me débrouille pour que les caractères qui reviennent le plus souvent soient traduit par des intervalles du haut de la liste, jusqu'à arriver aux caractères les plus rares qui seront traduits par des intervalles de la fin de la liste.

Voici un tableau qui montre en dégradé les intervalle du plus harmonieux (Vert) au plus dissonant (Jaune) :

Pour le lire c'est très simple, par exemple si j'ai décidé que le caractère 'o' serait le quatrième caractère le plus utilisé dans mon texte, alors je regarde où est le chiffre '4' dans le tableau alors je vois que sur sa ligne j'ai un FA et sa colonne un FA, donc sa traduction musicale sera un FA grave + un FA aigu. Maintenant si le 'm' est le 15ème caractère le plus courant alors le nombre '15' correspond à un DO grave + SOL aigu. Ainsi de suite.

3. Coder le texte complet

Une solution simple aurait été de me référer à la liste des caractères les plus utilisés en Français pour déterminer quels intervalles leurs faire correspondre avec le tableau précédent. Mais n'importe qui sachant quelle langue j'ai utilisé pour mon texte sera capable de déduire mon tableau. Pour ajouter un peu de piment à tout ça il suffit de déterminer la fréquence d'apparition des caractères au sein du texte et de ne se baser que là dessus !

Par exemple prenons la phrase "Ceci est un super test", on voit que les caractères sont au nombre de :
- 4 e
- 3 s
- 3 t
- 2 c
- 2 u
- 1 i
- 1 n
- 1 p
- 1 r

Ce qui donnerait replacés dans mon tableau :


Et donc le code musical suivant : FA/FA(c) DO/DO(e) FA/FA(c) LA/LA(i) - DO/DO(e) RE/RE(s) MI/MI(t) - SOL/SOL(u) SI/SI(n) - RE/RE(s) SOL/SOL(u) DO/MI(p) DO/DO(e) RE/FA(r) - MI/MI(t) DO/DO(e) RE/RE(s) MI/MI(t)

Et si on fait jouer ça à un instrument cela donne :


Marrant non ? Et il suffit de connaitre le tableau pour retrouver le message en fonction de la musique.


4. Programmer un encodeur

Pour automatiser tout ça je me suis amusé à développer un petit script en JavaScript avec AngularJS, dans lequel on a la possibilité de choisir quelle gamme on veut utiliser pour l'encodage et d'entrer le texte à coder, il sort directement une partition en fichier Midi qui est interprétable par n'importe quel ordinateur. Je le mettrais à disposition un de ces quatres quand j'aurais bien tout peaufiné et que j'aurais une solution d'hébergement en ligne perso. En attendant voici ce que ça donne avec un exemple de texte de Baudelaire (Merci Haalysse pour la citation) :



Et la musique est la suivante, j'ai remplacé toutes les espaces et la ponctuation par un couple DO/DO plus grave :



Et en bidouillant un peu, j'ai ajouté quelques notes de batterie, le tout codé cette fois ci en Si Mineur :



Maintenant la question et la prochaine étape, c'est comment coder les ponctuation ? Comment donner à la musique l'intonation en fonction de celle ci ? J'ai déjà une petite idée, la suite au prochain épisode !


Ma petite galerie graphique
  • 14 sujets
  • 296 réponses

Message posté le 22:02 - 28 févr. 2016

Lézard bouche bée essayant de comprendre le génie de la chose genre selon les besoins courants en cryptographie, sans compter les promesses "hasardeuses" pour taper des tubes.

Ca déchire.

Te faudrait vaguement un facteur qui permette de jouer avec la vélocité quand même. Comme amélioration. Et éventuellement coder quelque chose sur le tempo. Ca pourrait être fun pour la variété des morceaux.

  • 86 sujets
  • 561 réponses

Message posté le 13:18 - 29 févr. 2016

Eh, c'est vraiment super (: J'avais déjà eu ce genre de réflexion, non pas du côté cryptographie/lettres mais côté qualité du texte/phonèmes. Du coup, je me demande comment ca donnerait en se basant non pas sur els lettres, mais sur les phonèmes. Il y a légèrement plus de phonèmes que de lettres en français, mais je ne sais pas à quel point ca peut etre problématique dans ton code. Mais je me dis que ca rendrait surement beaucoup mieux le "ton" du texte, car on construit un texte plus autour de ses sons que de ses lettres.

Par ailleurs, je pense aussi que se baser sur les occurrences et pas sur les statistiques est une bonne idée.

Pour la ponctuation... Pourquoi pas se baser sur les silences ? alors certes, plusieurs ponctuations ont la même durée de silence. Mais de la même manière une ponctuation peut avoir plusieurs intonnations. Après, utiliser des silences... Ca risque de beaucoup hacher dans certains cas, je l'avoue.

A voir ce que ca pourrait donner ?

En tous cas, beau boulot ! :D C'est une idée très très sympa. Pour l'hébergement, vois peut etre avec Lepz ou Tear ?

  • 29 sujets
  • 180 réponses

Message posté le 15:48 - 29 févr. 2016

@Redofre : Ouep carrément, le travail sur la vélocité ça sera la prochaine étape, et les ponctuations des phrases pourraient donner un motif à la variation de la vélocité en leur sein, tout en jouant sur la longueur des silences, ou bien encore de la longueur des notes. A creuser.

@Chikoun : Mais grave, c'est ce que je m'étais dit aussi, ce serait vachement plus intéressant de se baser sur les sons du texte original pour en coder un nouveau musical. Mais deux difficultés : passer d'un texte, une chaine de caractère, à une suite de phonèmes. A moins d'avoir un dictionnaire qui établisse à l'avance quels mots contiennent quels phonème (un bon gros fichier texte des familles) je vois pas trop comment faire, algorithmiquement parlant. La deuxième difficulté c'est qu'il est aisé de passer d'un code à une suite de caractères, car les caractères mis bout à bout reconstituent tout seuls les phrases originales, or passer d'un code à un phonème bah ça donnerai une suite de phonèmes qu'il faudrait faire lire par un humain pour saisir les phrases (ou utiliser le dico précédent en sens inverse).

Mais pourquoi pas, il existe un ouvrage de référence qui dresse la liste des mots français et de leurs phonèmes ?

Pour les silences ça hache pas mal en effet, c'est notamment pour ça que dans mes deux exemples avec Baudelaire je les ai remplacés par des notes.


Ma petite galerie graphique
  • 86 sujets
  • 561 réponses

Message posté le 16:03 - 29 févr. 2016

Quand je cherche des trucs sur les phonèmes, j'utilise en général wikipedia, tout bêtement. C'est généralement assez complet

https://fr.wikipedia.org/wiki/Phon%C3%A8me > Pour la liste des phonèmes et diverses explications
https://fr.wikipedia.org/wiki/Liste_des_graphies_des_phon%C3%A8mes_du_fran%C3%A7ais > Pour la liste des graphies associés à chaque phonème.

  • 14 sujets
  • 296 réponses

Message posté le 16:14 - 29 févr. 2016

Je pense que pour suivre ton idée de ne pas passer par les statistiques mais par les occurrences, les silences nécessaires de la musique doivent trouver autre chose que la ponctuation. Possiblement plus rare.

Pour la vélocité par exemple j'aurais pensé à un truc comme les voyelles nasales/non nasales (qui compliquent beaucoup l'approche "phonèmes" en langue française), le japonais a qq chose comme 44 ou 46 caractères en phonèmes, en français il faudrait déjà multiplier ça par le nombre de voyelles nasalisables, grossièrement 4 (é/i= in, o = on, u= un, a = an). C'est grossier bien sur.

Mais pour faire moins grossier, je pense qu la langue française qui tend par nature à quelque chose d'un peu subtil et monocorde mériterait qu'on s'intéresse plus à l'intonation supposée (voir surjouée, ça transfère la part "non transcriptible" de la langue dans un medium fait pour: la musique) qu'à l'articulation trop précise de phonèmes vaguement différents. Le japonais encore une fois me parait un exemple super: ils transcrivent toutes les langues à partir de quelques phonèmes hyper restrictifs.

L'intérêt de tenir compte des accents toniques et intonations supposées c'est notamment que d'une langue à l'autre le code donne une musique au caractère relativement différent.

(quelqu'un a vu l'expérience consistant à faire écouter du faure et du haendel à des auditeurs et leur demander quelle musique est françaie ou anglaise? les statistiques, appuyées par une étude des intonations mélodiques ont montré que les compositeurs écrivaient en fait les mélodies dans "leur langue"... l'idée serait de détourner cette notion pour improviser un code intonatif qui ne soit plus mélodique mais joue sur un autre facteur)

Du coup à défaut de dictionnaire, je pense qu'il serait plus pratique dans ton cas de choisir les consonnes les plus essentielles, les coupler aux voyelles les plus essentielles, faire passer le multiplicateur nasal (4 on dit?) dans la vélocité, et éventuellement la ponctuation dans un filtre d'effet (mettons reverb ou delay pour les plus faciles à entendre et commencer les tests par quelque chose). Et les accents toniques et autres intonations dans un autre effet? Ou simplement des variations de volume?

(et quid des timbres? tu as pensé à coder des rythmes particuliers? on peut leur attribuer par exemple un contexte, ou une intention... ce sont aussi des éléments essentiels du langage qui ne sont pas transcriptibles mais que la musique port très bien).

Enfin, t'es l'ingénieur, c'est juste des idées comme ça.

  • 14 sujets
  • 227 réponses

Message posté le 17:50 - 29 févr. 2016

Wow, c'est génial !

Travailler sur les phonèmes est une bonne idée ; au vu de la page wikipédia de Chikoun ça ne doit pas être trop difficile de coder un traducteur texte/phonème, en revanche on limite le programme au français du coup.

Il y a autant de façons différentes d'encoder de la musique qu'on peut avoir d'idées. Certaines que tu as donné Redofre (l'intonation supposée) sont vraiment dures à mettre en place. Quant à la réverb et autres effets, je pense pas que ça puisse s'enregistrer dans un fichier MIDI, si ?

Ce qui est sûr, c'est qu'il y a trop d'espace pour les utiliser en tant que silences.

Si l'objectif est de faire ressembler à la prononciation, voici comment on pourrait utiliser les ponctuations les plus communes :

- virgule : petit silence.
- point-virgule : plus grand silence.
- point : encore plus grand silence.
- trois petits points : dernière note plus longue.
- point d'exclamation : dernière note plus forte ou crescendo pendant la phrase.
- pour le point d'interrogation je n'ai pas la moindre idée. Il faudrait voir avec les possibilités des fichiers MIDI.

En tout cas continue, c'est passionnant !

  • 86 sujets
  • 561 réponses

Message posté le 17:53 - 29 févr. 2016

point d'interrogation, une note plus courte ? Dans le sens où ca fait monter la voix, presque aiguë, et que ca la coupe, en quelque sorte.

  • 14 sujets
  • 296 réponses

Message posté le 19:03 - 29 févr. 2016

L'intonation n'est peut être pas si complexe que ça, il y a quelques accents toniques, et des montées de fréquence justement pour le point d'interrogation. Et en fait c'est à travers elle qu'à l'oral on symbolise la ponctuation (en fait c'est l'inverse, la ponctuation symbolise l'oral).
Et c'est justement ma logique là dedans: ne pas considérer l'écrit, mais l'oral. On peut le schématiser un peu et le résultat ne devrait pas être totalement complexe, mais plus mélodieux que des silences à répétition qui ne doivent leur concept qu'à la culture de la graphie. Ce qui au final fait passer de l'oral au sonore par la graphie de la langue... c'est complexe justement ça comme démarche.

  • 29 sujets
  • 180 réponses

Message posté le 23:32 - 1 mars 2016

Redofre tes idées sont super, mais le truc c'est que je ne veux pas faire une synthèse de voix, je veux vraiment faire autre chose, juste de la musique, c'est justement le but de perdre tout ce qui est intonation et variations dans la voix humaine : là c'est un langage musico/informatique nouveau qui ne doit rien avoir en commun avec la voix.

Donc je cherche à passer de la graphie au son, mais sans la considération de la voix, c'est pour ça que j'aime beaucoup l'idée des phonèmes de Chikoun car ça permet à la machine de faire une analyse sonore de ce qu'elle lit mais qu'elle est libre de traduire par n'importe quoi (son, lumière, nombres, ou que sais-je).

D'ailleurs ce soir j'ai commencé à plancher sur cette idée de phonèmes, j'ai codé un petit script d'analyse pour transformer le contenu de la page wiki de la liste des phonèmes Français en un dictionnaire de données facilement manipulable pour de l'analyse de chaines de caractères ensuite.

Ca me donne une "petite" liste de 818 couples phonèmes/graphèmes, qui si la page Wiki est complète représente l'ensemble des 39 sons indivisibles utilisés en Français et toutes leurs correspondances graphiques.

Pour les curieux voici cette liste, triée des graphèmes les plus longs au plus courts : phonemes.json
Bon certains caractères spéciaux ont merdé dans mon script, j'ai du chier dans la colle pour l'encodage, mais pas grave les caractères spéciaux ont été traduits par des chaines un peu bizarres mais uniques donc je pourrai rattraper ça plus tard (par exemple /ɛ̃/ est devenu /ɛ̃/ ou /ɑ̃/ est devenu /ɑ̃/).

Maintenant si je comprends ce principe, Chikoun corrige moi si je me trompe, n'importe quel mot Français est divisible en une suite de phonèmes, donc si j'analyse tous les mots en cherchant à chaque fois quels graphèmes les composent je suis capable de déterminer leurs phonèmes.

Par contre je remarque que certains graphèmes correspondent à plusieurs phonèmes, mais que c'est leur place dans le mot qui détermine quel phonème c'est vraiment.
Par exemple le graphème "eu" de "euphorie" est un /ø/ et le "eu" de "fleur" est un /œ/
Il y a une règle particulière là dessus ? ou c'est parce que dans euphorie il est en début de mot (je vois que ça fait pareil quand c'est en fin de mot) ?

Ensuite pour les graphèmes qui en contiennent d'autre, comme le "œuds" de "nœuds" qui est un /ø/ contient le graphème "œ" de "œil" qui lui est un /œ/, je pense que j'analyserai par taille décroissante de graphème : Par exemple avec "frein" le programme pourrait croire que "re" ou "e" ou "ei" sont des graphèmes alors qu'en fait le graphème c'est "eins" pour le phonème /ɛ̃/
Ce qui fait "frein" = f/r/eins = /f/ /ʁ/ /ɛ̃/
et pas f/r/e/i/ns = /f/ /ʁ/ /e/ /i/ /çaexistepasjesuisunprogrammeconquivaplanter/
J'ai l'impression qu'en général la priorité est donnée au graphème existant le plus long.

Le truc qui va être méga chaud c'est de passer dans l'autre sens, de phonème à graphème, vu qu'il y a 818 possibilité d'écriture pour seulement 39 sons ...

Mais bon, prochaine étape c'est de replacer les phonèmes par ordre d’occurrence dans un texte dans mon tableau que j'ai présenté plus tôt ici. L'avantage c'est que 39 possibilités ça rentre bien dans mes 49 cases.
Je pourrai aussi imaginer juste encoder les 818 graphèmes, mais pour ça faut que j'utilise plus d'informations pour les traduire, comme par exemple utiliser 3 notes au lieu de 2 ce qui donnerai 7x7x7 = 343 possibilités (et qui donneraient des accords en musique !), voir quatre notes (7 puissance 4 = 2401 possibilités !!!) pour pouvoir prévoir un texte qui contiendrait absolument tous les graphèmes existants.

Ça sera une option de mon programme tiens, je suis curieux de quel genre de musique émergerait de ça.


Ma petite galerie graphique
  • 86 sujets
  • 561 réponses

Message posté le 03:02 - 2 mars 2016

Oui, a priori, tu pourras, si tu connais tous les graphèmes, tu connaîtras tous les phonèmes. La question est celle que tu poses ensuite. Quid des graphèmes "composés", ces graphèmes plus longs qui en englobent d'autres. A mon avis ta logique est bonne de dire à ton programme de procéder de manière décroissante. Il faudrait vérifier si il n'y a pas des exception... mais a priori, cela me parait couvrir le cas commun, tout du moins.

La question de savoir comment retransmettre tes sons dans le bon graphème... A moins d'utiliser un dictionnaire phonétique, je pense que tu auras du mal. Mais dans ce cas, autant plus s'emmerder avec les graphèmes, et prendre directement une traduction "littérale" du dictionnaire phonétique mot > traduction phonétique > son, et plus mot > graphème > phonème > son. M'est avis que l'analyse du code musique>texte devra se faire essentiellement à la phonétique pour une lecture "propre", ou à l'approximatif pour une lecture "non initiée". Dans le sens où ton son va se transformer en phonème, et ton phonème, tu vas lui attribuer arbitrairement un graphème. Pourquoi pas décider arbitrairement que ce sera le graphème le plus courant dans la langue française, et puis le lecteur se débrouille pour lire ? Après tout, ci jeu t'ékri komme sa tu va comprendre. C'est pas propre, mais tu comprends.


Pour la différence de phonème pour un même graphème... on doit pouvoir distinguer une tendance générale, mais m'est avis que ca vient beaucoup de l'étymologie des mots (euphorie est grec et s'écrivait déjà eu, fleur est latin et s'écrivait o, ce qui explique que le "eu" de fleur soit très proche d'un "o" dans la prononciation, et pas celui de euphorie)

Sinon, tu l'évoques, il y a la solution d'un code plus précis. Tu oublies les phonèmes, et tu codes directement par graphème, avec tes 818 solutions. Ainsi, ton passage musique>texte sera tel qu'il était à l'origine, à peu de choses près.


Après j'y pense mais il y a la question des lettres muettes. Si tu passes par la solution du graphème pour distinguer les phonèmes, il va falloir apprendre à ton logiciel à ignorer certaines lettres. Les S de fin de mot, etc. Par ailleurs, il va traduire tous les pluriels "ent" en "en", etc. Ca va poser de gros soucis si tu veux que ta musique soit précise sur les sons, mais ca ne posera pas de soucis si ton objectif c'est que la personne qui traduit la musique ait le texte d'origine. (peu importe qu'il le traduise mal s'il le retraduit de la même manière ensuite dans l'autre sens, en somme, pas comme google traduction quoi :D) Mettons, il traduit vendent comme s'il avait en face de lui "v/an/d/an/t", peu importe, tant qu'ensuite il retranscrit bien "vendent" lorsqu'on traduit la musique.

  • 14 sujets
  • 296 réponses

Message posté le 13:04 - 2 mars 2016

je pense que vous m'avez mal compris. Vous parlez vous même de phonèmes (phonos=son...) donc vous partez bien du principe de ne pas passer par la graphie (la graphie c'est ce qui est complexe "pour rien" puisqu'elle tient compte de l'évolution... avec la phonétique, si on fait fi des régionalismes on peut arriver à quelque chose de simple, mais si on utilise l'alphabet phonétique on complique pour rien: ça ne sera pas une synthèse vocale, donc la prononciation "juste" ou "régionale" st un débat inutile ici, qui remplit pourtant l'alphabet phonétique).

Ce que j'appelle simple: https://upload.wikimedia.org/wikipedia/commons/thumb/0/0d/Table_katakana.svg/768px-Table_katakana.svg.png

Les japonais s'en tirent très bien en appliquant à toutes les langues, on peut inventer un équivalent français qui ne sera pas forcément beaucoup plus complexe, certes on fait fi de nombreuses nuances mais le but reste un codage différent d'une synthèse vocale ou graphique

Et passer par la graphie implique comme dit chik de passer de 43 à 864 solutions, ou compliquer en isolant chaque consonne et voyelle (les prononciations phonétiques françaises sont complexes, comme leurs gaphèmes, fussent ils phonétiques (ô, o etc...) et ça mérite simplification).

Notamment sur cette idée d'intonation, il ne s'agit pas de reproduire l'intonation, mais de la symboliser (entendre coder) à travers un élément musical qui n'est pas dans l'intonation (intonation=modulation de fréquence, je propose de transformer par exemple en modulation de volume, ou d'effet). Ca n'est donc pas une synthèse vocale, mais un transfert de logique d'une symbolique vers une autre. Sans passer par les travaux graphiques qui n'ont jamais été conçus dans le but de coder un langage musical.. donc restent inadaptés.

Et ça règle surtout avec une simplicité difficilement égalable le problème de la ponctuation.

  • 86 sujets
  • 561 réponses

Message posté le 17:57 - 2 mars 2016

La question de la graphie n'est pas une question de vouloir retranscrire la graphie, mais que pour passer d'un texte aux phonèmes, on se demande comment faire, et la réponse c'est soit écrire directement le texte en phonétique, mais ca nécessite de connaitre la phonétique, soit d'analyser la graphie pour en déduire les phonèmes.

  • 14 sujets
  • 296 réponses

Message posté le 18:27 - 4 mars 2016

Eh bien je propose d'élaborer un truc dans le genre du japonais: on analyse les besoins essentiels en phonèmes, sans imiter l'alphabet phonétique qui en a sélectionné un nombre qui dépasse ce qui serait fonctionnel dans ce cadre.
Par exemple les consonnes sont souvent doublées du fait qu'elles soient sourdes ou pas (exemple b/p) il a besoin de représenter la "surdité" et on garde le même code pour cette distinction entre f/v ou d/t.
On prend un autre élément qui codera les voyelles qui suivent ces consonnes, de manière à ne pas coder des lettres mais des syllabes (4 voyelles, ça peut très bien être la vélocité de départ sur la note par exemple).
Et je pense qu'on s'en sort avec un travail plus original (adapté) et moins complexe.

Je pensais récemment à la notion de cadences, mic, et à la variété qu'a apporté le jazz au niveau des renversements. Ca sert déjà de syntaxe d'une manière ou d'un autre, et ça peut enrichir le résultat final, mais j'ai pas trop creusé l'idée encore.

  • 7 sujets
  • 108 réponses

Message posté le 22:55 - 2 juil. 2016

Il existe bien des sites qui donnent la phonétique d'un mot quand on le tape, genre wordreference. Il faudrait alors indiquer la langue du texte que tu veux "sonifier", mais tu n'as plus besoin de te poser la question du dictionnaire ou de la traduction graphème->phonème.
Sinon, le résultat a de la gueule, tu arrives à donner du rythme à tes sons.

^