KB » Chinees » Chinese tekens op de computer

Het verwerken van Pinyin en Chinese karakters op de computer

    Tweeten

Het invoeren van karakters in documenten

De gratis Input Method Editor is in een Windows-omgeving in mijn ogen verreweg de simpelste en plezierigste manier om Chinese tekst in te voeren. Ik heb daar een aparte pagina aan gewijd.

Een recente nieuwe mogelijkheid is het gebruik maken van een (Engelstalige) website. Op de MDBG site kan je niet alleen woorden opzoeken van Engels naar Chinees en omgekeerd, maar ook karakters of Pinyin invoeren. Voor karakters klik je op Type Chinese in het menu aan de linkerkant.


Het invoeren van Pinyin tekens in documenten

Introductie

Een eenvoudige manier om Pinyin te produceren (in mail, tekstverwerker) is het installeren van een Pinyin font.

Een ongeveer even handige methode is de tekens op een website in te voeren.

Als je niet bang bent om veel te klikken en tussen vensters heen en weer te schakelen kan je ook gebruik maken van Speciale tekens (Character Map) (standaard aanwezig in Windows).

Gebruik maken van een font

Een voorbeeld is cpinyin0.ttf, dat bijvoorbeeld hier te downloaden is (klik op Fonts for Windows).

Een font kan je het gemakkelijkste installeren door met rechts te klikken op het bestand dat het font bevat, en dan te klikken op Installeren (Install)

Als die keuze niet bestaat (Windows XP?), klik dan op Start - Uitvoeren (Run), en tik in: fonts, gevolgd door Enter
Klik dan op Bestand (File) - Nieuw lettertype installeren (Install New Font), waarna je kan aangeven op welke plek je het font-bestand hebt staan.

Vanaf dat moment kan je in elk programma het Pinyin font kiezen net als je andere fonts zou kiezen. In Wordpad doe je bv. Opmaak (Format) - Lettertype (Font). Er verschijnt dan een lijst met fonts. Het font cpinyin0.ttf heeft de naam Chinese Pinyin.

Toetsen

De toetsen waaronder de Pinyin tekens zitten (dit geldt voor het font cpinyin0.ttf, en zal waarschijnlijk anders zijn voor andere Pinyin fonts):

ā: ` (linksboven) á: 1 ă: 2 à: 3
ē: 4 é: 5 ĕ: 6 è: 7
ī: % í: ^ ĭ: & ì: *
ō: 8 ó: 9 ǒ: 0 ò: -
ū: [ ú: { ǔ: } ù: ]
ǖ: = ǘ: + ǚ: | ǜ: \ (rechtsmidden)
Ā: ~ Á: ! Ă: @ À: #
Ē: $

Gebruik maken van een website

Een recente nieuwe mogelijkheid is het gebruiken maken van een (Engelstalige) website.

Op de MDBG site kan je niet alleen woorden opzoeken van Engels naar Chinees en omgekeerd, maar ook karakters of Pinyin invoeren.

Voor Pinyin klik je op Type Pīnyīn in het menu aan de linkerkant.

Speciale tekens (Character map)

M.b.v. de Speciale tekens moet je karakter voor karakter in je document plakken. Dit is zeeeeer bewerkelijk.

Het grote voordeel van de IME is dat hij karakters aanpast afhankelijk van de context. Als je bv. nĭ hăo intikt in de IME, weet hij precies welke 'ni' en welke 'hao' het meest waarschijnlijk zijn (nĭhăo is een veelgebruikte groet in het Chinees).

Start de Speciale tekens door te klikken op Start - Uitvoeren (Run), en tik dan in: charmap, gevolgd door Enter

Selecteer het aankruisvakje Geavanceerde weergave (Advanced view)

Je kan nu in de lijst Groeperen op (Group by) kiezen voor Simplified Chinese by PinYin
Door bv. de 'd' in te tikken krijg je dan alle karakters voor 'da', 'dai', 'dan', etc. in groepen te zien.

Vervolgens klik je op het gewenste karakter, dan op Selecteren (Select), dan op Kopiëren (Copy), en tenslotte plak je het karakter in het document.


Webpagina's lezen

Plaatjes versus codes

Op enkele webpagina's zijn (een deel van de) karakters als plaatjes (net als foto's) weergegeven. Om die karakters te kunnen zien hoef je niets bijzonders te doen. In onderstaande ga ik er van uit dat voor elk karakter een bepaalde code is gebruikt. Deze situatie komt verreweg het meeste voor.

Minimale vereiste

In de meeste gevallen zal het voldoende zijn om bestanden voor Oost-Aziatische talen te installeren. Hoe dat bv. voor Windows 7 en Windows XP moet staat op mijn pagina over IME

Character set/encoding (tekenset)

In waarschijnlijk vrij zeldzame gevallen moet je gaan sleutelen aan de character set (character encoding).

Wat je zelf in je browser kunt instellen hangt waarschijnlijk af van wat je vooraf hebt gedaan in het onderdeel Land en taal (Region and Language) (Windows 7) of Landinstellingen (Regional and Language Options) (Windows XP) van het Configuratiescherm (Control Panel)

Firefox 17

Character encoding instellen

Klik op Extra (Tools) - Opties (Options) - Inhoud (Content) - Geavanceerd (Advanced) (in het vak Lettertypen en kleuren (Fonts & Colors)). Maak een keuze in het onderste vak (Standaard tekenset (Character Encoding)).

Op dit moment heb ik als Character encoding Unicode (UTF-8) ingesteld, en ik heb nooit problemen met het lezen van Chinese tekst. Maar dat zal voor een groot deel liggen aan dat ik de Chinese taal heb geïnstalleerd.

Firefox View menu

Als je Chinese tekens niet kunt zien, klik dan op Beeld (View) - Tekenset (Character Encoding).

Onder de separator (scheidingsbalk) staat een lijst met beschikbare encodings. Normaal zal daar Westers (ISO-8859-1) (Western (ISO-8859-1)) geselecteerd zijn.

Ik denk dat je veel pagina's met Chinese tekst (of wat voor tekst dan ook) zult kunnen zien als je daar Unicode (UTF-8) selecteert.

Maar misschien heb je soms ook Vereenvoudigd Chinees (GB2312) (Chinese Simplified (GB2312)) of Traditioneel Chinees (Big5) (Chinese Traditional (Big5)) nodig.

De laatste 2 kun je toevoegen aan de lijst via Beeld (View) - Tekenset (Character Encoding) - Meer (More Encodings) - Oost-Aziatisch (East Asian)

Als je dan in plaats van Westers (Western) 1 van de Chinese alternatieve kiest zou je de meeste webpagina's moeten kunnen lezen.


Webpagina's maken

Pinyin

Met de volgende HTML codes produceer je de klinkers met de verschillende tonen:

ā: ā á: á ǎ: ǎ à: à
ē: ē é: é ě: ě è: è
ī: ī í: í ǐ: ǐ ì: ì
ō: ō ó: ó ǒ: ǒ ò: ò
ū: ū ú: ú ǔ: ǔ ù: ù
ǖ: ǖ ǘ: ǘ ǚ: ǚ ǜ: ǜ

En voor de hoofdletters:

Ā: Ā Á: Á Ǎ: Ǎ À: À
Ē: Ē É: É Ě: Ě È: È
Ī: Ī Í: Í Ǐ: Ǐ Ì: Ì
Ō: Ō Ó: Ó Ǒ: Ǒ Ò: Ò
Ū: Ū Ú: Ú Ǔ: Ǔ Ù: Ù
Ǖ: Ǖ Ǘ: Ǘ Ǚ: Ǚ Ǜ: Ǜ

Vanzelfsprekend is het geen lolletje om al die ingewikkelde codes met de hand te moeten invoeren. Ik kan op dit moment maar 2 oplossingen bedenken:

  1. maak gebruik van een of ander macro-systeem, bv. dat je m.b.v. Alt+F2 de à produceert;
  2. zet in webpagina 'a' gevolgd door een '4' als je à wilt weergeven, 'e' gevolgd door een '2' als je é wilt weergeven, etc. Schrijf in een of andere programmeertaal een programma om op alle pagina's van je site 'a' gevolgd door een '4' om te zetten in de code voor à, etc.

Ik heb gekozen voor de laatste oplossing, nl. met een programma in Perl. Perl is een gratis programmeertaal, maar niet de meest gebruikersvriendelijke.

Karakters op webpagina's maken

PSPad

Ik gebruik voor het maken van webpagina's een simpele editor (PSPad), en daarin kan je gewoon met de IME karakters produceren. Je moet wel 1 van de meest recente versies van PSPad gebruiken (4.5.3 is voldoende).

Binnen PSPad moet je mogelijk wel een aantal instellingen veranderen. (Op mijn huidige PC hoeft het niet, misschien omdat ik in de webpagina als character set utf-8 heb opgegeven?!) In het dialoogvenster dat je krijgt na Format - Font had ik op mijn vorige PC bij Font nSimSun staan, en bij Script CHINESE_GB2312 (dit staat voor de vereenvoudigde Chinese karakters).


Algemene forums



    Tweeten
© Henk Dalmolen
Reageer via E-mail (dalmolen@xs4all.nl)

Deze pagina is voor het laatst gewijzigd op: 21-04-19 17:11:31