EJEMPLO DE CODIFICACION CON EL ESTANDAR UTF-8 Incorporando este estándar en nuestra web, hace que podamos ver los contenidos texto-web en la mayoría de los idiomas utilizados en el mundo. No hay que confundir este sistema como si fuera un traductor. Se limita a posibilitar la representación general de los caracteres propios de otros idiomas, por ejemplo en árabe, que de otra forma no sería posible nada más que de forma individual; pero evidentemente tienen que estar escritos en árabe.

Técnicamente no es complicado, basta con añadir la etiqueta: <meta http-equiv="Content-Type" content="text/html; charset=utf-8"> en el cuerpo de cabecera del documento entre sus etiquetas de apertura y cierre <head> y </head>.                                                                                   Antonio J. Nevado (01.11.2006)

 

EN ESPAÑOL: Guiando la web hacia su máximo potencial…

Básicamente, los ordenadores sólo trabajan con números. Almacenan letras y otros caracteres mediante la asignación de un número a cada uno. Antes de que se inventara Unicode, existían cientos de sistemas de codificación distintos para asignar estos números. Ninguna codificación específica podía contener caracteres suficientes: por ejemplo, la Unión Europea, por sí sola, necesita varios sistemas de codificación distintos para cubrir todos sus idiomas. Incluso para un solo idioma como el inglés, no había un único sistema de codificación que se adecuara a todas las letras, signos de puntuación y símbolos técnicos de uso común.

Además, estos sistemas de codificación presentan problemas entre ellos. Es decir, dos sistemas de codificación pueden utilizar el mismo número para dos caracteres distintos o bien utilizar números distintos para el mismo carácter. Todo ordenador (especialmente los servidores) necesita ser compatible con muchos sistemas de codificación distintos; sin embargo, cada vez que los datos se traspasan entre distintos sistemas de codificación o plataformas, dichos datos siempre corren el riesgo de sufrir daños.


EN ALEMÁN: Alle Möglichkeiten des Web erschließen…

Grundsätzlich arbeiten Computer nur mit Zahlen. Buchstaben und andere Zeichen werden daher Zahlen zugeordnet um sie zu speichern. Vor der Erfindung von Unicode gab es hunderte unterschiedlicher Kodierungssysteme. Keines dieser Kodierungssysteme umfasste je genug Zeichen: So braucht die Europäische Union allein mehrere Kodierungssysteme um damit den Bedarf für die Sprachen aller Mitgliedsländer abzudecken. Nicht einmal für eine einzelne Sprache wie Englisch oder Deutsch gab es ein Kodierungssystem, das wirklich alle Buchstaben, Interpunktionszeichen und alle gebräuchlichen technischen Zeichen umfasste.

Diese Kodierungssysteme sind untereinander unverträglich, denn unterschiedliche Kodierungen können dieselbe Zahl für verschiedene Zeichen benutzen oder verschiedene Zahlen für dasselbe Zeichen. Jeder Rechner (vor allem Server) muss viele verschiedene Kodierungssysteme unterstützen; und wenn Text zwischen verschiedenen Kodierungssystemen oder Rechnersystemen ausgetauscht wird, läuft dieser Text Gefahr verstümmelt zu werden.


EN ÁRABE: ...لإيصال الشبكة المعلوماتية إلىأقصى إمكانياتها

أساسًا، تتعامل الحواسيب فقط مع الأرقام، وتقوم بتخزين الأحرف والمحارف الأخرى بعد أن تُعطي رقما معينا لكل واحد منها. وقبل اختراع "يونِكود"، كان هناك مئات الأنظمة للتشفير وتخصيص هذه الأرقام للمحارف، ولم يوجد نظام تشفير واحد يحتوي على جميع المحارف الضرورية. وعلى سبيل المثال، فإن الاتحاد الأوروبي لوحده، احتوى العديد من الشفرات المختلفة ليغطي جميع اللغات المستخدمة في الاتحاد. وحتى لو اعتبرنا لغة واحدة، كاللغة الإنجليزية، فإن جدول شفرة واحد لم يكف لاستيعاب جميع الأحرف وعلامات الترقيم والرموز الفنية والعلمية الشائعة الاستعمال.

وتجدر الملاحظة أن أنظمة التشفير المختلفة تتعارض مع بعضها البعض. وبعبارة أخرى، يمكن أن يستخدِم جدولي شفرة نفس الرقم لتمثيل محرفين مختلفين، أو رقمين مختلفين لتمثيل نفس المحرف. ولو أخذنا أي جهاز حاسوب، وبخاصة جهاز النادل (server)، فيجب أن تكون لديه القدرة على التعامل مع عدد كبير من الشفرات المختلفة، ويتم تصميمه على هذا الأساس. ومع ذلك، فعندما تمر البيانات عبر أنظمة مختلفة، توجد هناك خطورة لضياع أو تحريف بعض هذه البيانات.انات.


EN CHINO: 发网络的全部潜能…

基本上,電腦只是處理數位。它們指定一個數位,來儲存字母或其他字元。在創造Unicode之前,有數百種指定這些數位的編碼系統。沒有一個編碼可以包含足夠的字元:例如,單單歐州共同體就需要好幾種不同的編碼來包括所有的語言。即使是單一種語言,例如英語,也沒有哪一個編碼可以適用於所有的字母,標點符號,和常用的技術符號。

這些編碼系統也會互相衝突。也就是說,兩種編碼可能使用相同的數位代表兩個不同的字元,或使用不同的數位代表相同的字元。任何一台特定的電腦 (特別是伺服器都需要支援許多不同的編碼,但是,不論什麽時候資料通過不同的編碼或平臺之間,那些資料總會有損壞的危險。


EN COREANO: 웹의 모든 잠재력을 이끌어 내기 위하여…

기본적으로 컴퓨터는 숫자만 처리합니다. 글자나 다른 문자에도 숫자를 지정하여 저장합니다. 유니코드가 개발되기 전에는 이러한 숫자를 지정하기 위해 수백 가지의 다른 기호화 시스템을 사용했습니다. 단일 기호화 방법으로는 모든 문자를 포함할 수 없었습니다. 예를 들어 유럽 연합에서만 보더라도 모든 각 나라별 언어를 처리하려면 여러 개의 다른 기호화 방법이 필요합니다. 영어와 같은 단일 언어의 경우도 공통적으로 사용되는 모든 글자, 문장 부호 및 테크니컬 기호에 맞는 단일 기호화 방법을 갖고 있지 못하였습니다.

이러한 기호화 시스템은 또한 다른 기호화 시스템과 충돌합니다. 즉 두 가지 기호화 방법이 두 개의 다른 문자에 대해 같은 번호를 사용하거나 같은 문자에 대해 다른 번호를 사용할 수 있습니다. 주어진 모든 컴퓨터(특히 서버)는 서로 다른 여러 가지 기호화 방법을 지원해야 합니다. 그러나, 데이터를 서로 다른 기호화 방법이나 플랫폼 간에 전달할 때마다 그 데이터는 항상 손상의 위험을 겪게 됩니다.


EN FILANDÉS: Ohjaamassa Webin kehittymistä täyteen mittaansa…

Tietokoneiden toiminta perustuu numeroiden käsittelylle. Myös kirjaimet ja muut merkit ovat tietokoneiden muistissa lukusarjoina. Ennen Unicodea oli käytössä satoja eri tapoja esittää merkkejä ja kirjaimia mutta yksikään näistä koodisivuista ei kyennyt määrittämään kovin kattavaa merkistöä. Jo yksinomaan Euroopan Unionissa käytetyille kielille tarvitaan useita erilaisia merkistöjä ja koodisivuja, eikä edes englannin kaltaisen, yksinkertaisen kielen kaikkien kirjaimien, välimerkkien ja yleisten teknisten symbolien esittäminen onnistu yhdellä näistä koodisivuista.

Lisäksi koodisivut ovat ristiriidassa keskenään. Eri koodisivuilla voidaan käyttää samaa arvoa kahdelle täysin erilaiselle merkille tai samalla merkillä voi olla eri arvo eri koodivulla. Jokaisen tietokoneen, varsinkin jos kyseessä on palvelin, pitää tukea lukuisia eri merkistöjä ja koodisivuja ja kun tietoa siirretään järjestelmien ja merkistöjen välillä on tiedon vääristymisen ja tuhoutumisen riski suuri.


EN FRANCÉS: Amener le Web vers son plein potentiel...

Fondamentalement, les ordinateurs ne comprennent que les nombres. Ils codent les lettres et autres caractères sous formes de nombres. Avant l'invention d'Unicode, des centaines de systèmes de codage de caractères ont été créés. Pas un seul d'entre eux n'était satisfaisant : par exemple, l'Union Européenne a besoin de plusieurs systèmes de codage pour couvrir toutes ses langues d'usage. Même pour une seule langue comme le français, aucun système de codage ne couvrait toutes les lettres, les signes de ponctuation et les symboles techniques en usage courant.

Ces systèmes de codage sont souvent incompatibles entre eux. Ainsi, deux systèmes peuvent utiliser le même nombre pour deux caractères différents ou utiliser différents nombres pour le même caractère. Les ordinateurs, et plus particulièrement les serveurs, doivent supporter plusieurs systèmes de codage de caractères, ce qui crée un risque de corruption des données à chaque transition.


EN GRIEGO: Οδηγώντας τον παγκόμιο ιστό στο μέγιστο των δυνατοτήτων του…

Οι ηλεκτρονικοί υπολογιστές, σε τελική ανάλυση, χειρίζονται απλώς αριθμούς. Αποθηκεύουν γράμματα και άλλους χαρακτήρες αντιστοιχώντας στο καθένα τους από έναν αριθμό (ονομάζουμε μία τέτοια αντιστοιχία κωδικοσελίδα). Πριν την εφεύρεση του Unicode, υπήρχαν εκατοντάδες διαφορετικές κωδικοσελίδες. Λόγω περιορισμών μεγέθους όμως, σε καμία κωδικοσελίδα δεν χωρούσαν αρκετοί χαρακτήρες: λόγου χάριν, η Ευρωπαϊκή Ένωση χρειαζόταν πλήθος διαφορετικών κωδικοσελίδων για να καλύψει όλες τις γλώσσες των χωρών-μελών της. Ακόμα και για μία και μόνη γλώσσα, όπως π.χ. τα Αγγλικά, μία κωδικοσελίδα δεν επαρκούσε για να καλύψει όλα τα γράμματα, σημεία στίξης και τεχνικά σύμβολα ευρείας χρήσης.

Εκτός αυτού, οι κωδικοσελίδες αυτές διαφωνούσαν μεταξύ τους. Έτσι, δύο κωδικοσελίδες μπορούσαν κάλλιστα να χρησιμοποιούν τον ίδιο αριθμό για δύο διαφορετικούς χαρακτήρες, ή να χρησιμοποιούν διαφορετικούς αριθμούς για τον ίδιο χαρακτήρα. Κάθε υπολογιστής (και ιδίως εάν ήταν διακομιστής) έπρεπε να υποστηρίζει πλήθος διαφορετικών κωδικοσελίδων· ταυτόχρονα κάθε φορά που δεδομένα μεταφέρονταν μεταξύ διαφορετικών κωδικοσελίδων ή λειτουργικών συστημάτων, τα δεδομένα αυτά κινδύνευαν να αλλοιωθούν.


EN HEBREO: ...להוביל את הרשת למיצוי הפוטנציאל שלה

באופן בסיסי, מחשבים עוסקים רק במספרים. הם מאחסנים אותיות ותווים אחרים על-ידי הקצאת מספר לכל אחד מהם. בטרם הומצא היוניקוד, היו מאות מערכות קידוד שונות להקצאת המספרים הללו. אף לא אחת מהן יכלה להכיל כמות תווים מספקת. לדוגמא: רק לאיחוד האירופאי נדרשים כמה סוגי קידודים שונים על מנת לכסות את כל השפות המדוברות בו. יתירה מזאת אף לשפה בודדת, כמו אנגלית למשל, לא היה די במערכת קידוד אחת בעבור כל האותיות, סימני הפיסוק והסמלים הטכניים שבשימוש שוטף.

מערכות קידוד אלו אף סותרות זו את זו. כלומר, שני קידודים יכולים להשתמש באותו מספר לשני תוים נבדלים, או להשתמש במספרים שונים לאותו תו. על כל מחשב (ובמיוחד שרתים) לתמוך במספר רב של מערכות קידוד שונות; אולם כל אימת שנתונים עוברים בין מערכות קידוד או פלטפורמות שונות קיים הסיכון שייפגמו.


EN INGLÉS: Leading the Web to its Full Potential...

Fundamentally, computers just deal with numbers. They store letters and other characters by assigning a number for each one. Before Unicode was invented, there were hundreds of different encoding systems for assigning these numbers. No single encoding could contain enough characters: for example, the European Union alone requires several different encodings to cover all its languages. Even for a single language like English no single encoding was adequate for all the letters, punctuation, and technical symbols in common use.

These encoding systems also conflict with one another. That is, two encodings can use the same number for two different characters, or use different numbers for the same character. Any given computer (especially servers) needs to support many different encodings; yet whenever data is passed between different encodings or platforms, that data always runs the risk of corruption.


EN ITALIANO: Sviluppare al massimo il potenziale del Web...

I computer, in buona sostanza, non sanno far altro che trattare numeri. Per immagazzinare in memoria lettere o altri segni è necessario che a ogni carattere venga assegnato un numero. Esistono centinaia di sistemi di codifica, preesistenti a Unicode, e ognuno di questi abbina i numeri ai caratteri in modo differente. Nessuna di queste codifiche comprende un numero di caratteri sufficiente per tutte le circostanze. Per le sole lingue dell'Unione Europea, ad esempio, è necessario utilizzare parecchi sistemi di codifica distinti. Anche considerando una solo lingua, come l'italiano, non esiste una codifica unica che comprenda tutte le lettere e tutti i segni di punteggiatura e simboli tecnici di uso comune.

Questi sistemi di codifica, inoltre, sono in contraddizione l'uno con l'altro. Succede che due codifiche utilizzino lo stesso numero per due caratteri diversi o che, viceversa, adottino numeri diversi per lo stesso carattere. Qualsiasi elaboratore, e a maggior ragione un server di rete, ha bisogno di utilizzare codifiche diverse. Il problema è che, quando i dati passano da una codifica a un'altra, o da una piattaforma a un'altra, si corre il serio rischio di perdere informazioni.


EN PORTUGÉS: Levando a Web em direcção ao seu potencial màximo…

Fundamentalmente, os computadores lidam com números. Gravam letras e outros caracteres na memória designando um número para cada um deles. Antes de o Unicode ser inventado, havia centenas de sistemas diferentes de codificação . Nenhum destes sistemas de codificação, no entanto, poderia conter caracteres suficientes: por exemplo, a União Européia por si só requer vários sistemas de codificação diferentes para cobrir todas a línguas. Mesmo para uma única língua como o inglês não havia sistema de codificação adequado para todas as letras, pontuação e símbolos técnicos em uso corrente.

Estes sistemas de codificação são também conflitantes entre si. Em outras palavras, dois codificadores podem usar o mesmo número para dois caracteres diferentes ou usar números diferentes para o mesmo caracter. Qualquer computador em particular (especialmente os servidores) precisam suportar muitos codificadores diferentes; ainda assim toda as vezes que se passam dados entre codificadores ou plataformas diferentes, estes dados sempre correm o risco de serem corrompidos.


EN RUSO: Pаскрывая весь потенциал Сети…

По своей природе компьютеры могут работать лишь с числами. И для того, чтобы они могли хранить в памяти буквы или другие символы, каждому такому символу должно быть поставлено в соответствие число. До того, как появился Unicode, в мире имели хождение сотни различных схем подобного кодирования символов. Но ни одна из этих схем не была столь универсальной, чтобы описать все необходимые символы: например, только для кодирования букв, входящих в алфавиты языков Европейского Сообщества, необходимо было использовать несколько различных кодировок. По большому счёту даже и для отдельного языка, скажем, английского, не существовало единой системы кодирования, включавшей в себя все обычно используемые буквы, знаки пунктуации и технические символы.

Более того, все эти схемы кодирования часто даже не были совместимы друг с другом. К примеру, две разные кодировки могли использовать один и тот же код для представления двух разных символов или присваивать разные коды одной и той же букве. В этой ситуации для любого компьютера, а особенно сервера, приходилось поддерживать несколько разных кодировок, которые могли понадобиться, но даже и тогда при передаче данных на другую платформу или при их преобразовании в другую кодировку всегда оставался риск, что эти данные окажутся повреждёнными.


EN SUECO: Se till att Webben når sin fulla potential…

I grunden arbetar datorer bara med tal (nummer). Datorer lagrar bokstäver och andra tecken genom att ha olika tal för var och en av dem. Innan Unicode uppfanns, fanns det hundratals olika kodningssystem för att associera tecken med tal. Men ingen enskild av dessa kodningar kunde representera tillräckligt många tecken. Om vi till exempel ser bara till EU, behövdes ett flertal olika kodningssystem för att kunna representera text i alla språk inom EU. Inte ens för ett enskilt språk, t.ex. engelska eller svenska, var någon enskild kodning tillräcklig för alla de bokstäver, skiljetecken och tekniska symboler som är i allmänt bruk.

Dessa kodningssystem är också motstridiga, i den meningen att två kodningar kan använda samma nummer för olika tecken, eller olika nummer för samma tecken. En dator (speciellt om det är en serverdator) måste därför kunna hantera flera olika teckenkodningar. Men det finns ändå en risk för att texten mer eller mindre förstörs när teckenkodad textdata skickas med olika kodningar, eller mellan olika datorplattformar.


EN JAPONÉS: Webの可能性を最大限に導き出すために⋮

コンピューターは、本質的には数字しか扱うことができません。コンピューターは、文字や記号などのそれぞれに番号を割り振ることによって扱えるようにします。ユニコードが出来るまでは、これらの番号を割り振る仕組みが何百種類も存在しました。どの一つをとっても、十分な文字を含んではいませんでした。例えば、欧州連合一つを見ても、そのすべての言語をカバーするためには、いくつかの異なる符号化の仕組みが必要でした。英語のような一つの言語に限っても、一つだけの符号化の仕組みでは、一般的に使われるすべての文字、句読点、技術的な記号などを扱うには不十分でした。

これらの符号化の仕組みは、相互に矛盾するものでもありました。二つの異なる符号化の仕組みが、二つの異なる文字に同一の番号を付けることもできるし、同じ文字に異なる番号を付けることもできるのです。どのようなコンピューターも(特にサーバーは)多くの異なった符号化の仕組みをサポートする必要があります。たとえデータが異なる符号化の仕組みやプラットフォームを通過しても、いつどこでデータが乱れるか分からない危険を冒すことのなるのです。


Traducciones proporcionadas por eTranslate, UNICODE CONSORTIUM y W3C.org.

 

   Ir a la página de inicio de ñññ.ñeros.com

 

 

 

con EÑE y con ACENTO (en internet)