WikiDer > Lotus көп байтты таңбалар жинағы

Lotus Multi-Byte Character Set

The Lotus көп байтты таңбалар жинағы (LMBCS) меншік болып табылады көп байт таңбаларды кодтау бастапқыда 1988 жылы сағ Lotus Development Corporation Боб Балабанның және басқалардың қатысуымен.[1] Бір уақытта жасалған және кейбір проблемаларды шешкен LMBCS параллельді даму және мүмкін балама ретінде қарастырылуы мүмкін Юникод.[1] Максималды үйлесімділік үшін LMBCS-тің кейінгі шығарылымдары қосылады UTF-16 ішкі жиын ретінде[2][3]

Коммерциялық тұрғыдан LMBCS алғаш рет әдепкі таңбалар жиынтығы ретінде енгізілді Lotus 1-2-3 3 шығарылым үшін DOS 1989 жылдың наурызында[1][4] және Lotus 1-2-3 / G 1-шығарылым үшін OS / 2[1] 1990 жылы 8-разрядты ауыстырды Lotus International сипаттамалар жинағы (LICS) және ASCII Lotus 1-2-3 және нұсқаларының тек DOS нұсқаларында қолданылған Симфония.[5] LMBCS сонымен қатар қолданылады IBM/Лотос SmartSuite, Ескертулер және Домино,[1] сонымен қатар бірқатар үшінші тарап өнімдерінде.

LMBCS тілдерді қолдану үшін қажетті таңбаларды Латын,[6] Араб, Еврей, Грек және Кириллица[6] сценарийлер, Тай, Қытай, жапон[6] және Корей жазу жүйелері және техникалық белгілер.

Кодировкалар

Техникалық тұрғыдан LMBCS а қорғасын-байт кодтық нүкте 00 болатын кодтауалтылық сонымен қатар 20 кодтық нүктелералтылық (32) -ден 7F-ге дейіналтылық (127) ұқсас ASCII[1] (сонымен бірге LICS-ке).[5]

Код коды 00алтылық әрқашан ретінде қарастырылады NUL таңбасы қолданыстағы бағдарламалық жасақтама кітапханасымен максималды үйлесімділікті қамтамасыз ету нөлдік жолдар[1] сияқты көптеген бағдарламалау тілдерінде C.[a] Бұл тіпті UTF-16be кодтарына да қатысты, мұнда xx00 формасындағы код сөздеріалтылық кескінделген жеке пайдалануға арналған кодтар F6xx формасыменалтылық NUL байттарын пайдаланбау үшін кодтау кезінде,[7] және басқарушы таңбалардан қашу, мұнда 20алтылық 0F артынан C0 (бірақ C1 емес) басқару символдарына қосыладыалтылық қорғасын байты.[7]

Код 01алтылық 1F дейіналтылық, ASCII-де басқару кодтары ретінде қызмет ететін, 7F-ден жоғары кодтық нүктелердің анықтамасын ауыстыру үшін жетекші байт ретінде қолданыладыалтылық бірнеше арасында код топтары (ұқсас код беттері) және сонымен бірге сәйкес код тобы үшін бір немесе көп байтты сипатты анықтаңыз.[1]

Мысалы, код тобы 1 (топтық байт 01 баралтылық)[1] мен бірдей SBCS код 850, ал код тобы 16 (10 байт тобы бар)алтылық)[1] жапондықтарға ұқсас MBCS коды 932. Бірнеше байтты символдар екі немесе үш байтты қамтуы мүмкін.[7][6]

Жылы канондық LMBCS, әр таңба өзінің топтық байтынан басталады.[1]Ұзындығын азайту үшін оңтайландырылған немесе сығылған LMBCS а әдепкі код тобы немесе топтың оңтайландыру коды бір өтінім немесе процесс бойынша анықталуы мүмкін (пайда болу ықтималдығына сәйкес идеалды түрде таңдалады)[1] және түсіндіру кодына қандай-да бір жолмен жіберілуі керек (мысалы, сәйкес «LMBCS-» көрсету арқылы)n«аты).[8] Осылайша, осы таңбалар үшін топтық байтты алып тастауға болады.[1] Lotus 1-2-3 оңтайландыру тобының кодын тиісті бастапқы файлдың файл тақырыбынан алады,[7] Lotus Notes үшін оңтайландыру тобының коды әрқашан 01 болып бекітілгеналтылық.[2][7]

ӘдепкіТопБайтСипаттама
Жоқ00алтылық1[7]ЖОҚ
LMBCS-101алтылық2[7]Код парағы 850 (DOS латын-1)[2][7]
LMBCS-202алтылық2[7]Код парағы 851 (DOS грек)[2][7]
LMBCS-303алтылық2[7]Код парағы 1255 (Windows иврит)[2][7]
LMBCS-404алтылық2[7]Код 1256 бет (Windows араб тілі)[2][7]
LMBCS-505алтылық2[7]Код парағы 1251 (Windows кириллицасы)[2][7]
LMBCS-606алтылық2[7]Код парағы 852 (DOS Latin-2)[2][7]
Жоқ07алтылық1[7]БЕЛ[2]
LMBCS-808алтылық2[7]Код парағы 1254 (Windows түрік)[2][9][7]
Жоқ09алтылық1[7]TAB[2][9][7]
Жоқалтылық1[7]LF[2][9][7]
LMBCS-110Bалтылық2[7]Код 874 (Тай)[9][7]
(LMBCS-12)0Cалтылық2[7]Резервтелген[2]
Жоқ0Dалтылық1[7]CR[2][9][7]
(LMBCS-14)0Eалтылық2[7]Резервтелген[2]
(LMBCS-15)0Fалтылық2[7]C0 / C1 басқару кодтары ауыстырылды[7]
LMBCS-1610алтылық3[7]Код парағы 932/[2]943[7] (Жапонша / Shift-JIS)[2][9]
LMBCS-1711алтылық3[7]Код 949 бет/[2]1261[7] (Корей)[2][9]
LMBCS-1812алтылық3[7]Код 950 бет[2][7] (Дәстүрлі қытай / Тайвань / Үлкен5)[2][9]
LMBCS-1913алтылық3[7]Код 936 бет/[2]1386[7] (Жеңілдетілген қытай)[2][9]
(LMBCS-20)14алтылық3[7]UTF-16 (Юникод)[2][3][7]
Жоқ15алтылық3Резервтелген[2]
Жоқ16алтылық3Резервтелген[2]
Жоқ17алтылық3Резервтелген[2]
Жоқ18алтылық3Резервтелген[2]
Жоқ19алтылық1[7]Лотос 1-2-3 жүйе ауқымы[9][7]
Жоқалтылық3Резервтелген[2]
Жоқалтылық3Резервтелген[2]
Жоқалтылық3Резервтелген[2]
Жоқ1Dалтылық3Резервтелген[2]
Жоқалтылық3Резервтелген[2]
Жоқ1Fалтылық3Резервтелген[2]

Таңбалар жиынтығы

Префикстің жоқтығында код 32 (20) тармағын білдіредіалтылық) 127-ге дейін (7Fалтылық) келесідей түсіндіріледі (LMBCS кодтарына 32-ден 127-ге сәйкес):

Бір байт кодтары (ASCII/ISO-646-US[10])
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
2_
32
СП
0020
!
0021
"
0022
#
0023
$
0024
%
0025
&
0026
'
0027
(
0028
)
0029
*
002A
+
002B
,
002C
-
002D
.
002E
/
002F
3_
48
0
0030
1
0031
2
0032
3
0033
4
0034
5
0035
6
0036
7
0037
8
0038
9
0039
:
003A
;
003B
<
003C
=
003D
>
003E
?
003F
4_
64
@
0040
A
0041
B
0042
C
0043
Д.
0044
E
0045
F
0046
G
0047
H
0048
Мен
0049
Дж
004A
Қ
004B
L
004C
М
004D
N
004E
O
004F
5_
80
P
0050
Q
0051
R
0052
S
0053
Т
0054
U
0055
V
0056
W
0057
X
0058
Y
0059
З
005A
[
005B
\
005C
]
005D
^
005E
_
005F
6_
96
`
0060
а
0061
б
0062
c
0063
г.
0064
e
0065
f
0066
ж
0067
сағ
0068
мен
0069
j
006A
к
006B
л
006C
м
006D
n
006E
o
006F
7_
112
б
0070
q
0071
р
0072
с
0073
т
0074
сен
0075
v
0076
w
0077
х
0078
ж
0079
з
007A
{
007B
|
007C
}
007D
~
007E
DEL/
007F / 2302

  Хат  Нөмір  Тыныс белгілері  Таңба  Басқа  Белгісіз

1 топ

LMBCS 1 тобының коды 128 (80)алтылық) дейін 255 (FF)алтылық) сәйкес код нүктелерімен бірдей код 850 (DOS Latin-1), ал кодтық нүктелер 1 (01)алтылық) 127-ге дейін (7Fалтылық) келесі ерекшеліктер тізіміне сәйкес анықталады (LMBCS кодтарының 256 - 383 сәйкес):

LMBCS тобы 1, төменгі жартысы[11][10]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
ЖОҚ
0000

263A

263B

2665

2666

2663

2660

2022

25D8

25CB

25D9

2642

2640

266А

266B

263C
1_
16

25ВА

25C4

2195

203C

00B6
§
00A7

25AC

21A8

2191

2193

2192

2190

221F

2194

25В2

25BC
2_
32
¨
00A8
~
007E
˚
02DA
^
005E
`
0060
´
00B4

201C
'
0027

2026
-[b]
2013

2014
[c]
2018
[c]
2019

2039

203A
3_
48
¨[d]
00A8
~[d]
007E
˚[d]
02DA
^[d]
005E
`[d]
0060
´[d]
00B4

201E

201А

201D

2017
nbsp[c]
00A0
[c]
FFFD
4_
64
Œ
0152
œ
0153
Ÿ
0178
˙[c]
02D9
˚[c][d]
02DA

255E

255F

258C

2590
[c]
25CA
[c]
2318
[c]
F8FF
[c]
F8FE
Ω[c]
2126
5_
80

2568

2564

2565

2559

2558

2552

2553

256B

256А

2561

2562

2556

2555

255С

255В

2567
6_
96
ij
0133
IJ
0132

FB01

FB02
ʼn
0149
ŀ
0140
Ŀ
013F
¯[c]
00AF
˘[c]
02D8
˝[c]
02DD
˛[c]
02DB
ˇ[c]
02C7
~[c][d]
007E
^[c][d]
005E
7_
112

2020

2021
Ħ[c]
0126
ħ[c]
0127
Ŧ[c]
0166
ŧ[c]
0167

2122

2113
Ŋ[c]
014A
ŋ[c]
014B
ĸ[c]
0138
Кр[e]
 

2310

20А4

20А7

  Хат  Нөмір  Тыныс белгілері  Таңба  Басқа  Белгісіз  Юникодпен салыстырылған жеке пайдалану сипаты

2 топ

LMBCS 2 тобы 128 (80алтылық) дейін 255 (FF)алтылық) сәйкес код нүктелерімен бірдей код парағы 851 (DOS грек), ал код 1 (01) нүктелерін білдіредіалтылық) 127-ге дейін (7Fалтылық) келесі ерекшеліктер тізіміне сәйкес анықталады:[f]

LMBCS тобы 2, төменгі жартысы[11]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
ЖОҚ
0000
ͺ
037A
΅
0385
Ϊ
03АА
Ϋ
03AB

2015
΄
0384
ʼ
02BC
ʽ
02BD

203E

F862

F863
1_
16

F864

F865

21D5

215E

215D

215C

215В

F867

21D1

21D3

21D2

21D0

F868

21D4

F869

F89F
2_
32

F89E

F89D

F89C

F89B

F89A

F899

F898

F897

F896

F895

F894

F893

F892

F891

F890

F88F
3_
48

F88E

F88D

F88C

F88B

F88A

F889

F888

F887

F886

F885

F884

F883

F882

F881

F880

F866
4_
64

2220

2207

F87F

F87E

F87D

F87C

F87B

F87A

F879

F878

F877

F876

F875

F874

F873

F872
5_
80

2202

2135

2111

211C

F871

F870

F86F

F86E

F86D

F86C

F86B

220В

2208

2209

2286

2287
6_
96

2297

2295

2713

22C0

2201

222В

2200

2203

F86A

2032

2033

221E

221D
φ
03C6

222A

2229
7_
112

2261

2245

2265

2264

2320

2321

2260

2248

2044

2219

2030

221А

207F

2205

2282

2283

  Хат  Нөмір  Тыныс белгілері  Таңба  Басқа  Белгісіз  Юникодпен салыстырылған жеке пайдалану сипаты

6 топ

LMBCS 6 тобы 128 (80алтылық) дейін 255 (FF)алтылық) сәйкес код нүктелерімен бірдей код парағы 852 (DOS Latin-2), ал кодтық нүктелер 1 (01)алтылық) 127-ге дейін (7Fалтылық) келесі ерекшеліктер тізіміне сәйкес анықталады:[f]

LMBCS тобы 6, төменгі жартысы[11]
_0_1_2_3_4_5_6_7_8_9_A_B_C_D_E_F
0_
0
ЖОҚ
0000
ā
0101
Ĉ
0108
ĉ
0109
Ċ
010A
ċ
010B
Ē
0112
ē
0113
Ė
0116
ė
0117
Ĝ
011C
ĝ
011D
Ġ
0120
ġ
0121
Ģ
0122
ģ
0123
1_
16
Ĥ
0124
ĥ
0125
Ĩ
0128
ĩ
0129
Ī
012А
ī
012B
Į
012E
į
012F
Ĵ
0134
ĵ
0135
Ķ
0136
ķ
0137
Ļ
013B
ļ
013C
Ņ
0145
ņ
0146
2_
32
Ō
014C
ō
014D
Ŗ
0156
ŗ
0157
Ŝ
015C
ŝ
015D
Ũ
0168
ũ
0169
Ū
016А
ū
016B
Ŭ
016C
ŭ
016D
Ų
0172
ų
0173
Ā
0100
3_
48
4_
64
5_
80
6_
96
7_
112

  Хат  Нөмір  Тыныс белгілері  Таңба  Басқа  Белгісіз

Сондай-ақ қараңыз

Ескертулер

  1. ^ Lotus 1-2-3 3.0 шығарылымы үшін DOS және жаңа нұсқалары жазылған C.
  2. ^ (U + 2010), (U + 2011), (U + 2012), (U + 2013)
  3. ^ а б c г. e f ж сағ мен j к л м n o б q р с т сен v w х ж Құжаттамаға сәйкес бұл кодтық нүкте қолдамайды Lotus 1-2-3 3.1+ шығарылымы DOS және OS / 2 және одан бұрынғы нұсқалар үшін.
  4. ^ а б c г. e f ж сағ мен Үйлесімділігі үшін Lotus 1-2-3 5.0 шығарылымы.
  5. ^ Юникод үшін глифті анықтамайды тәждік валюта белгісі (Krone aka «Kr»), сондықтан бұл F8FB-ге нұсқайдыалтылық Юникодта Жеке пайдалану аймағы (PUA).
  6. ^ а б Құжаттама коды бойынша осы топтағы 1-ден 127-ге дейінгі тармақтар қолдамайды Lotus 1-2-3 3.1+ шығарылымы DOS және OS / 2 және одан бұрынғы нұсқалар үшін. Бұл нұсқалар тек 0 және 1 топтарын қамтитын LMBCS кодының 0-ден 511-ге дейінгі нүктелерін қолдайды.

Әдебиеттер тізімі

  1. ^ а б c г. e f ж сағ мен j к л м Балабан, Боб (2001). «Көптілділіктер жиынтығы - бұл не, оларды қалай қолдануға болады» (PDF). Looseleaf Software, Inc. Мұрағатталды (PDF) түпнұсқадан 2016-11-25. Алынған 2016-11-25.
  2. ^ а б c г. e f ж сағ мен j к л м n o б q р с т сен v w х ж з аа аб ак жарнама ае аф аг ах «Қосымша А. Кодтау схемалары». IBM Таңбалар туралы мәліметтердің архитектурасы. IBM (CDRA). Lotus көп байтты таңбалар жинағы (LMBCS). Мұрағатталды түпнұсқадан 2016-11-26 жж. Алынған 2016-11-26. Оңтайландыру мақсатында топтық байт алынып тасталады Ескертулер X'20 'және X'FF' арасындағы бір байтты мәндер үшін. Мысалы, LMBCS әрдайым 0x01 тобына оңтайландырылады, яғни бірінші байт 0x1F-тен үлкен болатын кез-келген таңбаның 0x01 топтық байты айқын емес болады.
  3. ^ а б Шерер, Маркус; Мюррей, Брендан (2000-06-02). «Re: MS Excel, Lotus 123 & Unicode». Мұрағатталды түпнұсқасынан 2016-12-06 ж. Алынған 2016-12-06.
  4. ^ «Kapitel 4. Kompatibilität mit anderen 1-2-3 Versionen - Zeichensätze» [4-тарау. Басқа 1-2-3 нұсқаларымен үйлесімділік - таңбалар жиынтығы]. Lotus 1-2-3 3.1 нұсқасының жаңартқышы [Жаңартушының анықтамалығы] (неміс тілінде) (1 ред.). Кембридж, MA, АҚШ: Lotus Development Corporation. 1989. 4-10-4-4 бб. 302173.
  5. ^ а б Каменц, Альфред; Вонхоген, Гельмут (1992). Dos große Buch zu Lotus 1-2-3 үшін DOS (неміс тілінде) (1 ред.) Деректер Беккер. 131–132, 357–358 беттер. ISBN 3-89011-375-3.
  6. ^ а б c г. Lotus - Notes ішіндегі - Notes архитектурасы және Domino сервері (PDF). Lotus Development Corporation. 2000. Мұрағатталды (PDF) түпнұсқадан 2016-12-12 жж. Алынған 2016-12-12. […] Notes бағдарламасында іштей қолданылған барлық мәтіндік деректерді кодтау үшін бір таңбалар жиынтығын, Lotus Multibyte Character Set (LMBCS) пайдаланады. Notes бірінші LMBCS-тен басқа таңбалар жиынтығына кодталған мәтінді енгізген кезде, ол мәтінді LMBCS жолына айналдырады, ал егер LMBCS-тен басқа символдар жиынтығында мәтін шығару керек болса, онда ол ішкі LMBCS жолын тиісті таңбалар жиынтығына аударады. Барлық мәтін LMBCS-мен ішкі пішімделгендіктен, мәтінді өңдеудің барлық операциялары [...] тек бір тәсілмен орындалады. LMBCS бір мәтіндік таңбаны бейнелеу үшін жадында үш байтқа дейін пайдаланады […]
  7. ^ а б c г. e f ж сағ мен j к л м n o б q р с т сен v w х ж з аа аб ак жарнама ае аф аг ах ai аж ақ ал мен ан ао ап ақ ар сияқты Мюррей, Брендан; Снайдер-Грант, Джим, редакция. (2016) [2000-02-09]. «ucnv_lmb.c». Юникодтың халықаралық компоненттері. Халықаралық іскерлік машиналар (IBM).
  8. ^ Батутис, Эдвард Дж. (2001-11-03). «Re: түрлендіргіш түрлері». Юникодтың халықаралық компоненттері (ICU). Мұрағатталды түпнұсқасынан 2016-12-06 ж. Алынған 2016-12-06.
  9. ^ а б c г. e f ж сағ мен j «LMBCS» (жапон тілінде). 2009-02-03. Мұрағатталды түпнұсқадан 2016-11-26 жж. Алынған 2016-11-26.[1]
  10. ^ а б «Anhang 2. Der Lotus Multibyte Zeichensatz (LMBCS)» [Қосымша 2. Lotus Multibyte таңбалар жинағы (LMBCS)]. Lotus 1-2-3 3.1 нұсқасы Referenzhandbuch [Lotus 1-2-3 3.1 нұсқасы бойынша анықтамалық нұсқаулық] (неміс тілінде) (1 ред.). Кембридж, MA, АҚШ: Lotus Development Corporation. 1989. A2-1 – A2-13 бб. 302168.
  11. ^ а б c «lmb-excp.ucm». 2000-02-10.

Әрі қарай оқу

Сыртқы сілтемелер