PROJET AUTOBLOG


le hollandais volant

Site original : le hollandais volant

⇐ retour index

Comment différencier le chinois du japonais (et du coréen) ?

mercredi 6 mars 2019 à 16:04

Prenons un exemple, genre ça :

i
Il s’agit de l’article premier de la déclaration universelle des droits de l’Homme. Savez-vous dire si c’est du chinois ? du japonais ? du coréen ?

Il y a plusieurs siècles, le japonais dérive du chinois. Le coréen anciennement également (j’y reviens). Les trois langues utilisent des sinogrames, qui représentent un mot, un fait ou une idée. Généralement, la même idée est représentée par des sinogrammes visuellement très proche en chinois et en japonais.

Par exemple, pour un chat :

Pour le chat, les sinogrammes chinois et japonais se ressemblent, non ? Celui du japonais est même quasi-identique à celui du chinois simplifié !

La version coréenne n’a rien à voir, et pour cause : ce ne sont pas des sinogrammes mais du hangeul. Après avoir été inventée au XVIe siècle, ils ont été interdits durant 500 ans (par le roi). Ce n’est qu’au XXe siècle qu’ils ont fait leur retour. Ce système a été créé (il y a longtemps, donc) pour sa simplicité et sa logique : la structure des mots est très rigoureuse et les traits sont très simples. Cela a permis (et permet aujourd’hui encore) une très forte alphabétisation de la population coréenne.

Des trois langues présentées ici, c’est celle qui est la plus simplement reconnaissable : un texte en coréen contient des formes simples (traits, angles, cercles…) propre au coréen. Voici la page « wikipédia » sur wikipédia pour le constater.

Il subsiste, à l’usage, encore quelques caractères issus du chinois (les hanja), mais la majorité des écrits en coréen se font en hangeul.

Bon, et pour le chinois et le japonais ?

Le japonais, contrairement au chinois, utilise plusieurs écritures en même temps. J’en ai déjà parlé dans un article :

Les kanji sont issus des sinogrammes : ils dérivent pleinement du chinois (de l’époque où les chinois contrôlaient le japon). Les kanjis sont souvent complexes et désignent là également des idées, des objets, au lieu de sons.
Les kana, sont des versions très simplifiés des sinogrammes : ils ont nettement moins de traits et sont nés de la simplification progressive de l’écriture de certains kanjis. Contrairement à ces derniers, les kanas désignent des sons (des syllabes, en fait) : il y a un kana pour dire « ra », un autre pour le « ma », ou pour le « mo », « mi »…

Les katakanas et les hiraganas sont des miroirs l’un de l’autre : il y a un tableau pour chaque écriture. Les deux écritures font doublon comme ça, mais ils sont utilisés différemment : les katakanas (ceux aux traits anguleux) sont utilisés pour des mots d’origine étrangers ou des noms propres, alors que les hiraganas (ceux aux traits arrondis) sont utilisés ailleurs.

Enfin, les kanjis sont utilisés pour les mots pour lesquels il en en existe un (« chat » par exemple), même si on pourrait très bien utiliser des kanas à la place.
Généralement, plus celui qui écrit un texte en japonais connaît de kanjis, plus il les utilise (et donc moins il y a de hiraganas).

Avec ça, on peut différencier le japonais du chinois : c’est le seul qui contiendra des kanas ; et les kanas sont facilement visibles : ce sont les caractères au traits moins nombreux. Un texte en japonais est donc bien moins dense que du chinois.

Voici le même texte qu’au début, en chinois et en japonais :

Chinois (simplifié) :

人人生而自由, 在尊严和权利上一律平等。他们赋有理性和良心,并应以兄弟关系的精神相对待。

Japonais (les hiraganas sont en rouge — aucun katakana ne figure dans ce texte) :

すべての人間、生まれながらにして自由でありかつ、尊厳権利と について平等である。人間、理性良心とをけられており、互いに同 胞精神をもって行動しなければならない

Pour comparer un peu plus, voici la première phrase de l’article wikipédia dédié à Wikipédia, en japonais (en rouge : hiraganas ; en bleu : katakana ; en noir : les kanji) :

ウィキペディア(英: Wikipedia)ウィキメディア財団運営しているインターネット百科事典であるコピーレフトライセンスのもとサイトアクセス可能もが無料自由編集参加できる。世界各言語展開されている

Dans un texte, ce sont ces caractères là qu’il faut rechercher : si vous les voyez, c’est du japonais. En particulier, recherchez le (lire « no »), qui est une particule grammaticale (marquant l’appartenance) spécifique au japonais mais relativement courante.

Si aucun kana ne figure dans un texte, en particulier que le , c’est qu’il s’agit certainement d’un texte en chinois.

Partager la culture est un devoir, pas un crime

jeudi 14 février 2019 à 19:18

un livre brûlant
Lire :

Imaginez :

Quels seront les livres qui vont être dé-écrit le mois prochain, et que nous auront le plaisir de ne plus pouvoir trouver nulle-part (sauf au marché noir) ?

Débile, non ?

Bah voilà : les connards du #copyreich font ça avec les films, les séries, la musique, et en fait toute la culture numérique.

Certains écrits ou représentations datant de 3 000 ans nous parviennent jusqu’à aujourd’hui, malgré le fait qu’ils soient sur un support de bois, de peau de bête ou d’os. Combien d’écrits et de représentations ne seront plus là, 3 000 ans dans le futur, à cause de ces salopards qui décident que ça doit rester leur propriété et ne surtout pas le diffuser si ça ne les enrichit pas ?

C’est sûrement pas grâce eux que l’on sait lire les hiéroglyphes et les textes anciens, ou qu’on a accès à toute la culture passée.
Vous imaginez si Champolion avait dit « Au nom d’Hadopi, la pierre de rosette est à moi, je ne vous dirais pas ce qu’elle contient ! ».

Dans ces conditions, le « marché noir » numérique est seul garant de la diversité culturelle, d’aujourd’hui et de demain.

Partager des films, de la musique, des livres… ce n’est pas un crime. C’est un devoir Humain : c’est assurer la pérennité de l’histoire de notre espèce. C’est l’Histoire qui garantit à notre civilisation le progrès et l’empêche de faire les mêmes erreurs plusieurs fois.

image de collective nouns

Les trucs qui me font détester votre site web en 2019

samedi 9 février 2019 à 13:37

Comme le veut désormais la tradition sur ce site, vu que je surfe pas mal sur le net et que je fais également dans le webmastering et le codage de sites web, voici une liste de pratiques de merdes qu’on trouve sur les sites web et qui m’énervent.

Mon premier article du genre date de 2014. J’ai refait une mise à jour en 2017, et me voilà désormais prêt pour en refaire un pour 2019.

Les notifications

le popup de demande de notification
Non, je veux pas de notifications à outrance.

Le HTML5 apporte plein de possibilités aux concepteurs de sites. L’une d’elles est l’ajout de notifications : un site web, un onglet peut ainsi envoyer une notification au navigateur et même au système. La notif s’affiche alors avec le reste des notifs du système.

Je le dis ici : non, je ne veux pas que votre site me notifie de quoi que ce soit. Je suis assez grand pour regarder l’onglet quand j’en ai envie. Et un popup qui me demande l’autorisation pour pouvoir afficher des notifs, c’est chiant car ça finit de toute façon systématiquement sur « ne jamais activer les notifications sur ce site ».

Rendez-nous plutôt les flux RSS ! C’est comme ça qu’on veut rester au courant des nouveautés de votre site. Ça marche très bien, le RSS.

(Et @Mozilla (et les autres navigateurs) : pitié, utilisez l’outil de notification du SYSTÈME, pas votre truc perso. Sous Mate, Firefox ne respecte pas Notify-OSD et c’est moche).

La géolocalisation

le popup de demande de localisation
Non, tu n’as pas à savoir où je vis.

Ok, celle-ci ne date pas de cette année, mais de plus en plus de site le demandent quand-même, et c’est généralement de façon totalement illégitime : que Google Maps ou OpenStreetMaps me le demande, ok, c’est normal. Mais ton blog personnel, non. Je viens ici pour lire ce que tu a à dire. Toi t’as pas besoin de savoir à 5 mètres près où je vis.

Les bots de hotline

le chatbot de la sncf
Oui ! J’ai une question : tu peux te casser, je suis en train réserver un billet de train, ok ?

Vous arrivez sur un site quelconque et un popup s’ouvre avec un soi-disant opérateur qui vous parle : « Bonjour, en quoi puis-je vous aider ? ». C’est particulièrement vrai pour les sites des SAV, de certains FAI, mais aussi quelques marchands en ligne.
Ils ne sont pas nouveaux, et à l’heure où je publie cet article ils sont moins présents (et moins pourris aussi), mais ils ne remplacent pas encore un formulaire bien foutu.

Un autre truc qu’ils ne remplaceront pas, c’est un humain à qui parler. On s’en fiche de votre chatbot. On ne veut pas parler à un robot. Si votre site est merdique au point que même vous vous savez qu’on aura besoin d’aide, je vous conseille plutôt de virer votre équipe de web-dév pour en recruter un autre.

Si votre site est merdique, la priorité est de le rendre plus accessible, pas de nous tenir la main pour contourner la merde.

À la place, mettez plutôt une page de contact (qui fonctionne) ou un e-mail / numéro de téléphone en bas de la page. C’est beaucoup plus efficace et vos utilisateurs vous remercieront.

Les sites qui stockent les mots de passe en clair

Ça ne se voit pas tout de suite, mais quand on s’inscrit sur un site, votre pseudo et votre mot de passe doivent être stockés quelque part. Comme ça, on peut se connecter la prochaine fois et le site vous reconnaît.
Il arrive que vous oubliez votre mot de passe. Dans ce cas, on utilise une fonction « mot de passe oublié » et le site enclenche une procédure de restauration du mot de passe. Si le site est bien fait, il envoie un lien sur votre boîte mail. En cliquant dessus, votre mot de passe (celui que vous avez oublié) est effacé de la base de donnée du site et vous êtes invités à en entrer un nouveau.

Si le site est mal foutu, alors l’ancien mot de passe vous est renvoyé par e-mail.

À première vue, vous renvoyer le mot de passe peut semble plus pratique et plus rapide. En réalité, il s’agit là d’une très mauvaise pratique.

En effet, ça signifie que le site peut connaître votre mot de passe : donc qu’il est stocké en clair dans la base de données, virtuellement à la vue de n’importe qui. La solution est alors de créer un « hash » du mot de passe (en gros, un code produit à partir du mot de passe, mais avec lequel retrouver le mot de passe est impossible). Comme ça, quand on se connecte, on recalcule le hash et c’est lui qu’on compare à ce qui se trouve dans la base de données. Comme ça, le site ne connaît pas votre mot de passe, et les administrateurs et les pirates non plus. C’est beaucoup plus sécurisé et c’est la bonne méthode aujourd’hui.

Sauf qu’en 2018, il y a toujours des sites qui stockent des mots de passe en clair… Et ça devient très grave. Même la CNIL condamne ces pratiques…

Les sites qui interdisent certains caractères dans le mot passe

C’est symptomatique du point précédent : si l’on stocke correctement un mot de passe, on le fait sous la forme d’un hash (donc une chaîne alpha numérique, empreinte du mot de passe). N’importe quel caractère peut être donné, ça finit toujours en hash.

Si l’on n’utilise pas un hash, alors oui il faut vérifier que le mot de passe ne va pas corrompre la base de données (et encore, avec les requêtes préparées, ce problème ne devrait plus en être un).

Quoi qu’il en soit, si je veux mettre @%£*ע#$☢☹⚠ dans mon mot de passe, je devrais pouvoir le faire. Quant à mettre une limite afin que les néophytes ne se trompent pas, ça revient à tirer tout le monde vers le bas.

Ça serait comme forcer tout le monde à boire de la purée ou de la bouillie sans aucun allergène sous prétexte que certains ne peuvent plus mâcher ou ne peuvent pas tout manger.

Éduquez plutôt les internautes, au lieu de faire un compromis sur la sécurité. À vous de voir : est-il plus probable que Mme Michu se trompe de mot de passe à cause de vous, ou que la CNIL vous tombe sur le dos avec 500 k€ d’amende pour un défaut dans votre sécurité ?

Les sites qui t’envoie un mail à chaque fois que tu te connectes

Certains sites t’envoient un mail à chaque fois que tu te connectes dessus. Si d’un point de vue sécuritaire ça peut paraître louable, ça fait surtout pas mal de spam.

En particulier, c’est ce que fait OVH Telecom, quand je me connecte à leur interface. Déjà, je me connecte depuis chez moi (donc avec l’IP qui m’est attribué), donc a priori ça ne devrait pas être frauduleux. Aucun moyen de désactiver ça, et aucun moyen de me mettre sur liste blanche. Mais surtout, c’est juste un e-mail pour me dire « vous vous êtes connectés » : il n’y a pas de 2FA ni rien.

Je ne vois pas trop l’utilité dans ce cas : si un pirate cherche à changer mon mot de passe, c’est à ce moment-là qu’il faut m’envoyer un e-mail (éventuellement avec un lien pour le changer).

Les e-mails de connexion qui arrivent en retard

Certains sites, que ce soit pour changer ton mot de passe ou justement confirmer une connexion, t’envoie un e-mail avec un lien de connexion. Ça c’est bien seulement si l’e-mail arrive dans les 30 secondes après avoir voulu se connecter.

S’il faut attendre ne serait-ce que 5 minutes, alors ça devient vite très chiant (oui on est la génération pressée, désolé).

Bien-sûr, je ne parle pas d’un grand site français qui met jusqu’à 4 heures pour envoyer un e-mail

Les pop-up pour le pistage

i
Encore heureux que tu respectes mon choix, connard !

Les navigateurs prévoient une fonction qui permet de spécifier au site visité qu’on ne souhaite pas être pisté. C’est plus ou moins respecté par les sites, mais ça a le mérite d’exister.

Certains sites n’ont pas vraiment compris les principes de base du « ne pas faire chier l’utilisateur » et qui affichent alors un joli pop-up en JS « Vous avez demandé à ne pas être pisté. OK/Annuler ». Suivi d’un second pop-up « Nous respectons votre choix. OK/Annuler ».

Ces popup sont bien-sûr bloquants et mettent en avant l’onglet en question (donc si t’étais en train de lire un truc dans un autre onglet, t’es dérangé).

Conseil aux pages-web :

i
(cf ce mème)

Respectez l’utilisateur et son choix. C’est son choix, vous respectez, point.

Les pop-up RGPD

Comme si les pop-up pour s’inscrire, pour follower, pour donner l’e-mail, pour accepter les cookies, pour demander la géolocalisation, pour confirmer le pas-de-pistage, pour demander de désactiver la pub, pour recommander Chrome, pour nous dire d’activer Flash… ne suffisaient pas, désormais il y a le RGPD.

C’est le règlement qui oblige les sites à nous demander la permission pour utiliser certains cookies. Au fond c’est une bonne chose, mais encore une fois, la façon dont c’est implémenté par les différents sites fait que c’est une entrave constante à la navigation.

Non seulement ces popup sont très chiants, mais surtout ils ne servent à rien : dans 90 % du temps, ils ne présentent qu’un bouton pour tout accepter (chose qu’ils veulent) et jamais pour tout refuser (choser qu’ils craignent) ; et comme nous on veut lire le putain d’article, on est obligé de tout accepter et au final le RGPD n’aura servi à rien. Enfin si : maintenant en cas de problème, le site pourra se défausser sur nous : « ah, mais mon bon monsieur, vous avez accepté et maintenant votre numéro de téléphone est dans la nature ».

(Et à vrai dire, ça fait plutôt double emploi avec la fonction déjà présente dans mon navigateur pour bloquer le pistage, et celui pour bloquer les cookies tiers, mais c’est un problème d’incompétence de nos élus).

Les mesures anti-scroll

J’ai déjà parlé des mesures anti-clic-droit l’an dernier, et des mesures visant à capturer les événements qu’on produit en faisant des raccourcis claviers (Alt, Shift, etc.). Jusqu’à récemment je n’avais encore pas vu un autre truc : une méthode qui m’empêche de produire un « clic-molette » sur la page, pour scroller très vite tout en bas ou tout en haut.

Du coup, sur une page de 3km, je vois obligé de faire fumer la molette manuellement. C’est ridicule : arrêtez de capturer les événements par défaut !

Laissez notre souris et notre clavier tranquilles, à la fin ! Si vous voulez utiliser des raccourcis clavier, il existe déjà un truc pour ça (les accesskey). C’est ensuite le navigateur qui fait en sorte que ça n’entre pas en conflit avec les autres raccourcis claviers.

Ce blog a 10 ans \o/

jeudi 7 février 2019 à 07:31

photo d’un gâteau
Juste pour vous annoncer que ce site a désormais 10 ans (et selon la légende de ce vaisseau, j’ai le droit de passer une journée sur terre, après 10 ans en mer :p).

Ce site a débuté le 7 février 2009.

À l’époque ce n’étaient que quelques pages HTML très très moches (le blog n’était pas même là : il est venu quelques mois plus tard seulement). J’étais encore étudiant quand j’ai commencé, je sortais de lycée, en réalité. Beaucoup de choses se sont passées depuis, mais je suis toujours là.

Je ne vais pas tout raconter (ça serait trop long, et pas sûr que ça intéresse), mais je tenais à marquer le coup avec un petit article, et surtout à vous remercier : vous faites partie de ce blog, de cette aventure. Beaucoup d’articles sont venus de choses que vous m’avez partagé (par e-mail, sur Twitter, etc.) et j’ai appris plus que jamais en interagissant avec vous tous. Merci pour tout ça.

Malgré quelques passages à vide en ces dernier temps, j’ai repris un peu ce blog en main. À vrai dire, je me suis beaucoup investit sur mon blog scientifique, pour lequel j’ai beaucoup écrit.

Je compte bien essayer de maintenir le cap : partager ce qui me tient à cœur, que ça plaise ou non.
La plupart d’entre-vous ont compris cela : je discute souvent avec certains à propos de ce que j’écris (ils se reconnaîtront) et on échange nos avis, ceux qui convergent et ceux qui divergent : c’est un vrai plaisir.

J’ai aussi fait des erreurs, mais je travaille dessus. Vous êtes nombreux à avoir l’œil vigilant et beaucoup me remontent les conneries que je poste quand ça arrive : merci pour ça aussi, non seulement vous me corrigez, mais vous participez également à réduire l’information fausse qui circule et ça c’est un bien important, pour aujourd’hui mais aussi pour « demain ».

Autrement, ce site, c’est, à ce jour :

Enfin, pour en savoir plus sur le site, c’est là (ou ) et pour quelques trucs sur moi, c’est là (ou au besoin).

Bref, bon anniversaire le Le Hollandais Volant, et on lève l’ancre pour les 10 années qui viennent, toujours sans pub ni mouchards (mais avec une page tipeee) ?

ÉDIT :
Au fait, voilà à quoi ressemblait le site par le passé le thème de mon site.

Et pour ceux qui sont curieux de savoir comment ça se passe de l’autre côté, le blog tourne avec un CMS maison ; et écrire un article ressemble à ça.

image d’en-tête de Will

Détruire la mythe de la batterie qui se charge en 3 secondes

lundi 4 février 2019 à 22:14

recharger un PC
Actuellement, le principal problème des appareils électriques comme les téléphones et les voitures électriques, c’est l’autonomie et le temps de charge. Aussi, si le temps de charge était réduit à quelques secondes, un gros problème serait déjà résolu.

Malheureusement, ça ne sera jamais le cas.

C’est une question de débit d’énergie électrique, autrement dit de puissance. Aujourd’hui, la majorité des téléphones sont rechargés avec de l’USB, en général sous 5 volt et 1 ampère (5 V/1 A), soit 5×1 = 5 W de puissance.

Une batterie Li-ion de 3 000 mAh contient 11,1 Wh d’énergie. Ça signifie, qu’il faudrait 1 h pour recharger le téléphone sous 11,1 W. Avec la puissance de l’USB, il faut donc 11,1 Wh ÷ 5 W = 2,22 heures (2 h 15 environ — en réalité il faut un peu plus, à cause des circuits internes et des pertes, comme l’échauffement).

Le truc maintenant : si on veut diviser le temps de charge par 2, 5 ou 10, alors il faut augmenter la puissance par 2, 5 ou 10.

Réduire le temps de chargement à 3 secondes revient utiliser un facteur de 2 700 (car 2 700 × 3 secondes correspondent à 2 h 15 minutes). La puissance, devra-t-elle être multipliée par 2 700.

De 5 W, on passera à 13 500 W. Cette puissance est celle de 18 chevaux (des « chevaux-vapeur »).

C’est une puissance considérable : la plupart des maisons sont équipées pour 6 000 W ou 9 000 W (des kVA en fait, mais c’est pas le sujet). Recharger un téléphone, même pendant seulement 3 secondes fera sauter les plombs chez vous, vous évitant de brûler votre maison avec une puissance trop important traversant votre installation électrique.

Et ça, c’est simplement pour recharger un téléphone de 150 grammes.
Pour une voiture électrique contenant environ 900 kilos de batteries, la puissance requise pour la recharger en 3 secondes serait celle d’une ville de 30 000 habitants.

C’est ridicule.

Alors oui, on peut essayer de faire mieux que 45 minutes, et réduire ça à 30 voire 15 minutes (ce qui serait déjà pas mal), mais guère au-delà. Déjà parce que votre maison ne le supporterait pas, mais votre téléphone non plus. Déjà que la charge « rapide » en USB-C est mauvaise et chauffe votre appareil, alors une puissance encore plus grande… n’en parlons pas.

image d’en-tête de James Chao

Oui, j’avais déjà fait un article sur la question, mais j’espère que celui-ci est plus clair.