ISO/IEC 8859

ISO/IEC 8859는 컴퓨터에서 8비트로 문자를 나타내기 위한 ISOIEC의 공동 표준이다. ISO/IEC 8859-1, ISO/IEC 8859-2 등의 세부 표준이 제안되어 있다.

ISO/IEC 8859 파트 1, 2, 3, 4는 원래 Ecma 인터내셔널 표준 ECMA-94이었다.

소개

ASCII에 포함된 95자의 인쇄 영역은 현대 영어로 정보를 표현하는 데 충분하다. 하지만 로마 문자를 쓰는 다른 언어에는 ASCII로 처리할 수 없는 추가적인 기호를 포함하고 있다. 예를 들면 ß(독일어), ñ(에스파냐어), å(스웨덴어와 북유럽 언어) 등이다. ISO 8859는 8비트로 구성된 바이트의 8번째 비트를 이용하여 128자의 추가적인 문자를 할당하여 이 문제를 처리하기 위해 제안되었다. 하지만 한 종류의 문자 집합만으로는 필요로 하는 모든 문자를 처리할 수 없어 여러 가지 매핑이 개발되었다.

ISO 8859-n 부호화는 인쇄 가능한 문자만을 포함한다. 문자가 대응되지 않은 곳은 제어 문자로 활용된다. IANAISO/IEC 646에 정의된 C0 영역(0-31)과 ISO 6429에 정의된 C1 영역(127-159)을 제어 문자로 사용한다. 이 문자 집합 이름은 MIME 이름으로도 활용된다.

구성

ISO/IEC 8859는 다음 문자 집합으로 이루어져 있다.

ISO/IEC 8859-1
ISO/IEC 8859-2
ISO/IEC 8859-3
ISO/IEC 8859-4
ISO/IEC 8859-5
ISO/IEC 8859-6
  • 라틴/아랍
  • 아랍어를 지원한다. 아랍 문자를 쓰는 다른 언어는 지원하지 않는다. 표시를 위해서는 양방향 문자와 문자 결합을 처리해줘야 한다.
ISO/IEC 8859-7
  • 라틴/그리스
  • 현대 그리스어를 지원한다. 문자 개혁 이전의 고전 그리스어(polytonic orthography)는 유니코드에서 지원한다.
ISO/IEC 8859-8
  • 라틴/히브리
  • 이스라엘에서 쓰이는 현대 히브리어를 지원한다. 좌에서 우, 또는 우에서 좌 두가지 방향의 인코딩이 모두 존재한다.
ISO/IEC 8859-9
ISO/IEC 8859-10
  • 라틴-6
    노르딕
  • 라틴-4의 문자를 재배열했다. 노르딕 언어의 표기에 더 적합하다. 발트 언어에게는 라틴-4가 더 편리하다.
ISO/IEC 8859-11
  • 라틴/타이
  • 타이어 (언어):타이어에서 쓰이는 여러 문자를 추가했다.TIS 620과 동일하다.
ISO/IEC 8859-12
  • 라틴/데바나가리
  • 데바나가리 문자를 위한 ISO의 작업은 1997년 공식적으로 폐기되었다. 데바나가리 문자는 ISCII와 유니코드가 지원한다.
ISO/IEC 8859-13
  • 라틴-7
    발트 해 연안
  • 라틴-4와 라틴-6에 빠진 발트 언어의 문자를 추가했다.
ISO/IEC 8859-14
  • 라틴-8
    켈트
  • 스코틀란드게일어나 브르타뉴어 등의 켈트어를 지원한다.
ISO/IEC 8859-15
ISO/IEC 8859-16
ISO/IEC 8859 간의 비교
BinOctDecHex123456789101113141516
10100000240160A0Non-breaking space (NBSP)
10100001241161A1¡ĄĦĄЁ  ¡Ą¡Ą
10100010242162A2¢˘ĸЂ ¢¢Ē¢¢ą
10100011243163A3£Ł£ŖЃ £Ģ£Ł
10100100244164A4¤Є¤¤Ī¤Ċ
10100101245165A5¥Ľ ĨЅ ¥Ĩċ¥
10100110246166A6¦ŚĤĻІ ¦Ķ¦Š
10100111247167A7§Ї §§
10101000250168A8¨Ј ¨ĻØš
10101001251169A9©ŠİŠЉ ©Đ©
10101010252170AAªŞĒЊ ͺתŠŖªȘ
10101011253171AB«ŤĞĢЋ «Ŧ««
10101100254172AC¬ŹĴŦЌ،¬Ž¬¬Ź
10101101255173ADsoft hyphen (SHY)SHY
10101110256174AE®Ž ŽЎ  ®Ū®ź
10101111257175AF¯Ż¯Џ ¯ŊÆŸ¯Ż
10110000260176B0°А °°°
10110001261177B1±ąħąБ ±ą±±
10110010262178B2²˛²˛В ²ē²Ġ²Č
10110011263179B3³ł³ŗГ ³ģ³ġ³ł
10110100264180B4´Д ΄´īŽ
10110101265181B5µľµĩЕ ΅µĩµµ
10110110266182B6śĥļЖ Άķ
10110111267183B7·ˇ·ˇЗ ···
10111000270184B8¸И Έ¸ļøž
10111001271185B9¹šıšЙ Ή¹đ¹¹č
10111010272186BAºşēК Ί÷ºšŗºș
10111011273187BB»ťğģЛ؛»ŧ»»
10111100274188BC¼źĵŧМ Ό¼ž¼Œ
10111101275189BD½˝½ŊН ½½œ
10111110276190BE¾ž žО Ύ¾ū¾Ÿ
10111111277191BF¿żŋП؟Ώ ¿ŋæ¿ż
11000000300192C0ÀŔÀĀР ΐ ÀĀĄÀ
11000001301193C1ÁСءΑ ÁĮÁ
11000010302194C2ÂТآΒ ÂĀÂ
11000011303195C3ÃĂ ÃУأΓ ÃĆÃĂ
11000100304196C4ÄФؤΔ ÄÄ
11000101305197C5ÅĹĊÅХإΕ ÅÅĆ
11000110306198C6ÆĆĈÆЦئΖ ÆĘÆ
11000111307199C7ÇĮЧاΗ ÇĮĒÇ
11001000310200C8ÈČÈČШبΘ ÈČČÈ
11001001311201C9ÉЩةΙ ÉÉ
11001010312202CAÊĘÊĘЪتΚ ÊĘŹÊ
11001011313203CBËЫثΛ ËĖË
11001100314204CCÌĚÌĖЬجΜ ÌĖĢÌ
11001101315205CDÍЭحΝ ÍĶÍ
11001110316206CEÎЮخΞ ÎĪÎ
11001111317207CFÏĎÏĪЯدΟ ÏĻÏ
11010000320208D0ÐĐ ĐаذΠ ĞЊŴÐ
11010001321209D1ÑŃÑŅбرΡ ÑŅŃÑŃ
11010010322210D2ÒŇÒŌвز  ÒŌŅÒ
11010011323211D3ÓĶгسΣ ÓÓ
11010100324212D4ÔдشΤ ÔŌÔ
11010101325213D5ŐĠÕеصΥ ÕŐ
11010110326214D6ÖжضΦ ÖÖ
11010111327215D7×зطΧ ×Ũ×׌
11011000330216D8ØŘĜØиظΨ ØŲØŰ
11011001331217D9ÙŮÙŲйعΩ ÙŲŁÙ
11011010332218DAÚкغΪ ÚŚÚ
11011011333219DBÛŰÛл Ϋ Û ŪÛ
11011100334220DCÜм ά Ü Ü
11011101335221DDÝŬŨн έ İÝ ŻÝĘ
11011110336222DEÞŢŜŪо ή ŞÞ ŽŶÞȚ
11011111337223DFßп ίß฿ß
11100000340224E0àŕàāрـΰאàāąà
11100001341225E1áсفαבáįá
11100010342226E2âтقβגâāâ
11100011343227E3ãă ãуكγדãćãă
11100100344228E4äфلδהää
11100101345229E5åĺċåхمεוååć
11100110346230E6æćĉæцنζזæęæ
11100111347231E7ÇįчهηחÇįēÇ
11101000350232E8ÈčÈčшوθטÈččÈ
11101001351233E9ÉщىιיÉÉ
11101010352234EAÊęÊęъيκךÊęźÊ
11101011353235EBËыًλכËėË
11101100354236ECÌěÌėьٌμלÌėģÌ
11101101355237EDÍэٍνםÍķÍ
11101110356238EEîюَξמîīî
11101111357239EFïďïīяُοןïļï
11110000360240F0ðđ đȑِπנğðšŵðđ
11110001361241F1ñńñņёّρסñņńñń
11110010362242F2òňòōђْςעòōņò
11110011363243F3óķѓ σףóó
11110100364244F4ôє τפôōô
11110101365245F5őġõѕ υץõő
11110110366246F6öі φצöö
11110111367247F7÷ї χק÷ũ÷÷ś
11111000370248F8øřĝøј ψרøųøű
11111001371249F9ùůùųљ ωשùųłù
11111010372250FAúњ ϊתúśú
11111011373251FBûűûћ ϋ ûūû
11111100374252FCüќ ό ü ü
11111101375253FDýŭũ§ ύLRMıý żýę
11111110376254FEþţŝūў ώRLMşþ žŷþț
11111111377255FFÿ˙џ   ÿĸ ÿ
  • 0xA0위치에는 NBSP(non breaking space) 문자가, 0xAD에는 대개 소프트 하이픈(soft hyphen) 문자가 놓여있다. 다른 빈 자리는 할당되지 않은 영역이거나 현재 사용자 시스템이 표시할 수 없는 글자이다.
  • ISO/IEC 8859-7:2003과 ISO/IEC 8859-8:1999에서 새로 추가된 영역이 있다. LRM은 좌에서 우표시(U+200E), RLM은 우에서 좌 표시(U+200F)에 대응한다.