mercredi, janvier 26, 2011

Le sens des harmoniques dans le script java

Quand mon analyseur de courbe modélise la voix humaine sur la lettre "O", il m'indique que c'est l'amplitude basse qui doit être avant le front descendant.  Il m'indique aussi que la première harmonique représente la dérivation la plus simple qui soit donc une dérivation d'ordre 1, et son amplitude est tout naturellement à 63% de la valeur max. (cf. je n'utilise pas l'algèbre car cet outil est incohérent pour modéliser, j'utilise la méthode que je préconise depuis 1993 basée sur un système exponentiel).

En image voici comment écrire ceci en java, mais en premier une capture d'écran du son "O"


Nous remarquons le front descendant sur l'amplitude basse sur le son "O"


De même ici sur le fichier son joué en java nous avons la même chose.


Nous remarquons que contrairement à ce qui nous semblerait logique, l'harmonique ici est placée sur la première ligne  (F2 est placée sur onde1) et la base du son sur la deuxième ligne ( F1 avec onde2). Cet acte permet de reproduire le sens particulier donnée par la voix humaine.


La dernière capture d'écran montre que sur le script java onde 1 est bien placé avant onde2


Cinq minutes de rire pour un adulte, durent une éternité pour un enfant.

dimanche, janvier 16, 2011

Modélisation de la voix humaine




La technique montre comment créer des fichiers musicaux en ligne de commande. En d'autres mots, un simple fichier texte de quelques ko peut produire des heures d'enregistrement. J'ai mis cette technique au point de manière à pouvoir créer mon propre format audio nommé jo. Je développe en premier mon format audio en direction de la reconnaissance vocale de manière à intégrer dans mon "constructeur d'exercices en ligne" la possibilité de pouvoir répondre oralement. J'ai pu réaliser cette technique en moins de quinze jours en prenant pour principe que chaque chose n'est analysable que par rapport à elle-même, et mon propre système mathématique ; rendant par la même tout raisonnement construit sur l'algèbre totalement illogique. L'homme jugera si l'encodage construit sur l'algèbre peut rivaliser sur un encodage construit sur la logique.











Cinq minutes de rire pour un adulte, durent une éternité pour un enfant.

mardi, janvier 11, 2011

Reconnaissance vocale suite

Le projet reconnaissance vocal avance.
Une bibliothèque de plusieurs mots basiques est en cours de création, le format audio sera le ".jo"
La technique utilisée passe par une api alsa qui nous donne un signal échantillonné, ce signal échantillonné est analysé au premier blanc de manière à identifier combien de formes de courbe composent le mot, par exemple pour le terme "bonjour" nous en trouvons cinq "la courbe particulière du son "ou" pourra être utilisée pour d'autres mots. Chaque courbe est identifiée à l'aide de mon modèle mathématique à l'aide d'un nombre sans dimension (très léger puisque cela remplace des milliers de points). Une des autres forces de la bibliothèque, c'est qu'elle ne contiendra que des possibles, avec une bases de construction limité à certains mots utiles au constructeur d'exercice, donc ce qui permet d'éliminer tous les bruits et de gagner en rapidité. Le constructeur/décodeur  de fichier en point "jo" est prévu pour l'instant en java (suite à mes tests), mais à l'utilisation je fixerai le langage final. Les codes sources seront placés dans un de mes domaines, celui du constructeur d'exercices.

Cinq minutes de rire pour un adulte, durent une éternité pour un enfant.

samedi, janvier 08, 2011

Reconnaissance vocale

 Dans le but de faire avancé le projet d'exercices en auto-formation ou examen en ligne, j'ai développé un logiciel de modélisation des formes de variations. A l'aide de ce logiciel, je suis entrain de mettre au point mon propre format audio, que je nomme en " .jo "
L'avantage de ce nouveau format audio, c'est qu'il est beaucoup plus léger que tous les format existant, car il n'utilise pas de système incohérent issus de l'algèbre. Il identifie des formes de variations possibles et ainsi arrive à identifier les termes dans les fichiers son. La vidéo montre bien qu'il suffit d'indiquer x fois cette forme de courbe est beaucoup plus léger qu'échantillonner en écrivant une donnée à chaque croisement de la fréquence d'échantillonnage. Les deux vidéo dessous en disent un peu plus.





Cinq minutes de rire pour un adulte, durent une éternité pour un enfant.