xref: /haiku/src/libs/iconv/iso2022_jp1.h (revision aef5731f38da6f7b913e0f64acd8a40555491ce5)
1*aef5731fSOliver Tappe /*
2*aef5731fSOliver Tappe  * Copyright (C) 1999-2001 Free Software Foundation, Inc.
3*aef5731fSOliver Tappe  * This file is part of the GNU LIBICONV Library.
4*aef5731fSOliver Tappe  *
5*aef5731fSOliver Tappe  * The GNU LIBICONV Library is free software; you can redistribute it
6*aef5731fSOliver Tappe  * and/or modify it under the terms of the GNU Library General Public
7*aef5731fSOliver Tappe  * License as published by the Free Software Foundation; either version 2
8*aef5731fSOliver Tappe  * of the License, or (at your option) any later version.
9*aef5731fSOliver Tappe  *
10*aef5731fSOliver Tappe  * The GNU LIBICONV Library is distributed in the hope that it will be
11*aef5731fSOliver Tappe  * useful, but WITHOUT ANY WARRANTY; without even the implied warranty of
12*aef5731fSOliver Tappe  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13*aef5731fSOliver Tappe  * Library General Public License for more details.
14*aef5731fSOliver Tappe  *
15*aef5731fSOliver Tappe  * You should have received a copy of the GNU Library General Public
16*aef5731fSOliver Tappe  * License along with the GNU LIBICONV Library; see the file COPYING.LIB.
17*aef5731fSOliver Tappe  * If not, write to the Free Software Foundation, Inc., 51 Franklin Street,
18*aef5731fSOliver Tappe  * Fifth Floor, Boston, MA 02110-1301, USA.
19*aef5731fSOliver Tappe  */
20*aef5731fSOliver Tappe 
21*aef5731fSOliver Tappe /*
22*aef5731fSOliver Tappe  * ISO-2022-JP-1
23*aef5731fSOliver Tappe  */
24*aef5731fSOliver Tappe 
25*aef5731fSOliver Tappe /* Specification: RFC 2237 */
26*aef5731fSOliver Tappe 
27*aef5731fSOliver Tappe #define ESC 0x1b
28*aef5731fSOliver Tappe 
29*aef5731fSOliver Tappe /*
30*aef5731fSOliver Tappe  * The state can be one of the following values.
31*aef5731fSOliver Tappe  */
32*aef5731fSOliver Tappe #define STATE_ASCII          0
33*aef5731fSOliver Tappe #define STATE_JISX0201ROMAN  1
34*aef5731fSOliver Tappe #define STATE_JISX0208       2
35*aef5731fSOliver Tappe #define STATE_JISX0212       3
36*aef5731fSOliver Tappe 
37*aef5731fSOliver Tappe static int
iso2022_jp1_mbtowc(conv_t conv,ucs4_t * pwc,const unsigned char * s,int n)38*aef5731fSOliver Tappe iso2022_jp1_mbtowc (conv_t conv, ucs4_t *pwc, const unsigned char *s, int n)
39*aef5731fSOliver Tappe {
40*aef5731fSOliver Tappe   state_t state = conv->istate;
41*aef5731fSOliver Tappe   int count = 0;
42*aef5731fSOliver Tappe   unsigned char c;
43*aef5731fSOliver Tappe   for (;;) {
44*aef5731fSOliver Tappe     c = *s;
45*aef5731fSOliver Tappe     if (c == ESC) {
46*aef5731fSOliver Tappe       if (n < count+3)
47*aef5731fSOliver Tappe         goto none;
48*aef5731fSOliver Tappe       if (s[1] == '(') {
49*aef5731fSOliver Tappe         if (s[2] == 'B') {
50*aef5731fSOliver Tappe           state = STATE_ASCII;
51*aef5731fSOliver Tappe           s += 3; count += 3;
52*aef5731fSOliver Tappe           if (n < count+1)
53*aef5731fSOliver Tappe             goto none;
54*aef5731fSOliver Tappe           continue;
55*aef5731fSOliver Tappe         }
56*aef5731fSOliver Tappe         if (s[2] == 'J') {
57*aef5731fSOliver Tappe           state = STATE_JISX0201ROMAN;
58*aef5731fSOliver Tappe           s += 3; count += 3;
59*aef5731fSOliver Tappe           if (n < count+1)
60*aef5731fSOliver Tappe             goto none;
61*aef5731fSOliver Tappe           continue;
62*aef5731fSOliver Tappe         }
63*aef5731fSOliver Tappe         return RET_ILSEQ;
64*aef5731fSOliver Tappe       }
65*aef5731fSOliver Tappe       if (s[1] == '$') {
66*aef5731fSOliver Tappe         if (s[2] == '@' || s[2] == 'B') {
67*aef5731fSOliver Tappe           /* We don't distinguish JIS X 0208-1978 and JIS X 0208-1983. */
68*aef5731fSOliver Tappe           state = STATE_JISX0208;
69*aef5731fSOliver Tappe           s += 3; count += 3;
70*aef5731fSOliver Tappe           if (n < count+1)
71*aef5731fSOliver Tappe             goto none;
72*aef5731fSOliver Tappe           continue;
73*aef5731fSOliver Tappe         }
74*aef5731fSOliver Tappe         if (s[2] == '(') {
75*aef5731fSOliver Tappe           if (n < count+4)
76*aef5731fSOliver Tappe             goto none;
77*aef5731fSOliver Tappe           if (s[3] == 'D') {
78*aef5731fSOliver Tappe             state = STATE_JISX0212;
79*aef5731fSOliver Tappe             s += 4; count += 4;
80*aef5731fSOliver Tappe             if (n < count+1)
81*aef5731fSOliver Tappe               goto none;
82*aef5731fSOliver Tappe             continue;
83*aef5731fSOliver Tappe           }
84*aef5731fSOliver Tappe         }
85*aef5731fSOliver Tappe         return RET_ILSEQ;
86*aef5731fSOliver Tappe       }
87*aef5731fSOliver Tappe       return RET_ILSEQ;
88*aef5731fSOliver Tappe     }
89*aef5731fSOliver Tappe     break;
90*aef5731fSOliver Tappe   }
91*aef5731fSOliver Tappe   switch (state) {
92*aef5731fSOliver Tappe     case STATE_ASCII:
93*aef5731fSOliver Tappe       if (c < 0x80) {
94*aef5731fSOliver Tappe         int ret = ascii_mbtowc(conv,pwc,s,1);
95*aef5731fSOliver Tappe         if (ret == RET_ILSEQ)
96*aef5731fSOliver Tappe           return RET_ILSEQ;
97*aef5731fSOliver Tappe         if (ret != 1) abort();
98*aef5731fSOliver Tappe         conv->istate = state;
99*aef5731fSOliver Tappe         return count+1;
100*aef5731fSOliver Tappe       } else
101*aef5731fSOliver Tappe         return RET_ILSEQ;
102*aef5731fSOliver Tappe     case STATE_JISX0201ROMAN:
103*aef5731fSOliver Tappe       if (c < 0x80) {
104*aef5731fSOliver Tappe         int ret = jisx0201_mbtowc(conv,pwc,s,1);
105*aef5731fSOliver Tappe         if (ret == RET_ILSEQ)
106*aef5731fSOliver Tappe           return RET_ILSEQ;
107*aef5731fSOliver Tappe         if (ret != 1) abort();
108*aef5731fSOliver Tappe         conv->istate = state;
109*aef5731fSOliver Tappe         return count+1;
110*aef5731fSOliver Tappe       } else
111*aef5731fSOliver Tappe         return RET_ILSEQ;
112*aef5731fSOliver Tappe     case STATE_JISX0208:
113*aef5731fSOliver Tappe       if (n < count+2)
114*aef5731fSOliver Tappe         goto none;
115*aef5731fSOliver Tappe       if (s[0] < 0x80 && s[1] < 0x80) {
116*aef5731fSOliver Tappe         int ret = jisx0208_mbtowc(conv,pwc,s,2);
117*aef5731fSOliver Tappe         if (ret == RET_ILSEQ)
118*aef5731fSOliver Tappe           return RET_ILSEQ;
119*aef5731fSOliver Tappe         if (ret != 2) abort();
120*aef5731fSOliver Tappe         conv->istate = state;
121*aef5731fSOliver Tappe         return count+2;
122*aef5731fSOliver Tappe       } else
123*aef5731fSOliver Tappe         return RET_ILSEQ;
124*aef5731fSOliver Tappe     case STATE_JISX0212:
125*aef5731fSOliver Tappe       if (n < count+2)
126*aef5731fSOliver Tappe         goto none;
127*aef5731fSOliver Tappe       if (s[0] < 0x80 && s[1] < 0x80) {
128*aef5731fSOliver Tappe         int ret = jisx0212_mbtowc(conv,pwc,s,2);
129*aef5731fSOliver Tappe         if (ret == RET_ILSEQ)
130*aef5731fSOliver Tappe           return RET_ILSEQ;
131*aef5731fSOliver Tappe         if (ret != 2) abort();
132*aef5731fSOliver Tappe         conv->istate = state;
133*aef5731fSOliver Tappe         return count+2;
134*aef5731fSOliver Tappe       } else
135*aef5731fSOliver Tappe         return RET_ILSEQ;
136*aef5731fSOliver Tappe     default: abort();
137*aef5731fSOliver Tappe   }
138*aef5731fSOliver Tappe 
139*aef5731fSOliver Tappe none:
140*aef5731fSOliver Tappe   conv->istate = state;
141*aef5731fSOliver Tappe   return RET_TOOFEW(count);
142*aef5731fSOliver Tappe }
143*aef5731fSOliver Tappe 
144*aef5731fSOliver Tappe static int
iso2022_jp1_wctomb(conv_t conv,unsigned char * r,ucs4_t wc,int n)145*aef5731fSOliver Tappe iso2022_jp1_wctomb (conv_t conv, unsigned char *r, ucs4_t wc, int n)
146*aef5731fSOliver Tappe {
147*aef5731fSOliver Tappe   state_t state = conv->ostate;
148*aef5731fSOliver Tappe   unsigned char buf[2];
149*aef5731fSOliver Tappe   int ret;
150*aef5731fSOliver Tappe 
151*aef5731fSOliver Tappe   /* Try ASCII. */
152*aef5731fSOliver Tappe   ret = ascii_wctomb(conv,buf,wc,1);
153*aef5731fSOliver Tappe   if (ret != RET_ILUNI) {
154*aef5731fSOliver Tappe     if (ret != 1) abort();
155*aef5731fSOliver Tappe     if (buf[0] < 0x80) {
156*aef5731fSOliver Tappe       int count = (state == STATE_ASCII ? 1 : 4);
157*aef5731fSOliver Tappe       if (n < count)
158*aef5731fSOliver Tappe         return RET_TOOSMALL;
159*aef5731fSOliver Tappe       if (state != STATE_ASCII) {
160*aef5731fSOliver Tappe         r[0] = ESC;
161*aef5731fSOliver Tappe         r[1] = '(';
162*aef5731fSOliver Tappe         r[2] = 'B';
163*aef5731fSOliver Tappe         r += 3;
164*aef5731fSOliver Tappe         state = STATE_ASCII;
165*aef5731fSOliver Tappe       }
166*aef5731fSOliver Tappe       r[0] = buf[0];
167*aef5731fSOliver Tappe       conv->ostate = state;
168*aef5731fSOliver Tappe       return count;
169*aef5731fSOliver Tappe     }
170*aef5731fSOliver Tappe   }
171*aef5731fSOliver Tappe 
172*aef5731fSOliver Tappe   /* Try JIS X 0201-1976 Roman. */
173*aef5731fSOliver Tappe   ret = jisx0201_wctomb(conv,buf,wc,1);
174*aef5731fSOliver Tappe   if (ret != RET_ILUNI) {
175*aef5731fSOliver Tappe     if (ret != 1) abort();
176*aef5731fSOliver Tappe     if (buf[0] < 0x80) {
177*aef5731fSOliver Tappe       int count = (state == STATE_JISX0201ROMAN ? 1 : 4);
178*aef5731fSOliver Tappe       if (n < count)
179*aef5731fSOliver Tappe         return RET_TOOSMALL;
180*aef5731fSOliver Tappe       if (state != STATE_JISX0201ROMAN) {
181*aef5731fSOliver Tappe         r[0] = ESC;
182*aef5731fSOliver Tappe         r[1] = '(';
183*aef5731fSOliver Tappe         r[2] = 'J';
184*aef5731fSOliver Tappe         r += 3;
185*aef5731fSOliver Tappe         state = STATE_JISX0201ROMAN;
186*aef5731fSOliver Tappe       }
187*aef5731fSOliver Tappe       r[0] = buf[0];
188*aef5731fSOliver Tappe       conv->ostate = state;
189*aef5731fSOliver Tappe       return count;
190*aef5731fSOliver Tappe     }
191*aef5731fSOliver Tappe   }
192*aef5731fSOliver Tappe 
193*aef5731fSOliver Tappe   /* Try JIS X 0208-1990 in place of JIS X 0208-1978 and JIS X 0208-1983. */
194*aef5731fSOliver Tappe   ret = jisx0208_wctomb(conv,buf,wc,2);
195*aef5731fSOliver Tappe   if (ret != RET_ILUNI) {
196*aef5731fSOliver Tappe     if (ret != 2) abort();
197*aef5731fSOliver Tappe     if (buf[0] < 0x80 && buf[1] < 0x80) {
198*aef5731fSOliver Tappe       int count = (state == STATE_JISX0208 ? 2 : 5);
199*aef5731fSOliver Tappe       if (n < count)
200*aef5731fSOliver Tappe         return RET_TOOSMALL;
201*aef5731fSOliver Tappe       if (state != STATE_JISX0208) {
202*aef5731fSOliver Tappe         r[0] = ESC;
203*aef5731fSOliver Tappe         r[1] = '$';
204*aef5731fSOliver Tappe         r[2] = 'B';
205*aef5731fSOliver Tappe         r += 3;
206*aef5731fSOliver Tappe         state = STATE_JISX0208;
207*aef5731fSOliver Tappe       }
208*aef5731fSOliver Tappe       r[0] = buf[0];
209*aef5731fSOliver Tappe       r[1] = buf[1];
210*aef5731fSOliver Tappe       conv->ostate = state;
211*aef5731fSOliver Tappe       return count;
212*aef5731fSOliver Tappe     }
213*aef5731fSOliver Tappe   }
214*aef5731fSOliver Tappe 
215*aef5731fSOliver Tappe   /* Try JIS X 0212-1990. */
216*aef5731fSOliver Tappe   ret = jisx0212_wctomb(conv,buf,wc,2);
217*aef5731fSOliver Tappe   if (ret != RET_ILUNI) {
218*aef5731fSOliver Tappe     if (ret != 2) abort();
219*aef5731fSOliver Tappe     if (buf[0] < 0x80 && buf[1] < 0x80) {
220*aef5731fSOliver Tappe       int count = (state == STATE_JISX0212 ? 2 : 6);
221*aef5731fSOliver Tappe       if (n < count)
222*aef5731fSOliver Tappe         return RET_TOOSMALL;
223*aef5731fSOliver Tappe       if (state != STATE_JISX0212) {
224*aef5731fSOliver Tappe         r[0] = ESC;
225*aef5731fSOliver Tappe         r[1] = '$';
226*aef5731fSOliver Tappe         r[2] = '(';
227*aef5731fSOliver Tappe         r[3] = 'D';
228*aef5731fSOliver Tappe         r += 4;
229*aef5731fSOliver Tappe         state = STATE_JISX0212;
230*aef5731fSOliver Tappe       }
231*aef5731fSOliver Tappe       r[0] = buf[0];
232*aef5731fSOliver Tappe       r[1] = buf[1];
233*aef5731fSOliver Tappe       conv->ostate = state;
234*aef5731fSOliver Tappe       return count;
235*aef5731fSOliver Tappe     }
236*aef5731fSOliver Tappe   }
237*aef5731fSOliver Tappe 
238*aef5731fSOliver Tappe   return RET_ILUNI;
239*aef5731fSOliver Tappe }
240*aef5731fSOliver Tappe 
241*aef5731fSOliver Tappe static int
iso2022_jp1_reset(conv_t conv,unsigned char * r,int n)242*aef5731fSOliver Tappe iso2022_jp1_reset (conv_t conv, unsigned char *r, int n)
243*aef5731fSOliver Tappe {
244*aef5731fSOliver Tappe   state_t state = conv->ostate;
245*aef5731fSOliver Tappe   if (state != STATE_ASCII) {
246*aef5731fSOliver Tappe     if (n < 3)
247*aef5731fSOliver Tappe       return RET_TOOSMALL;
248*aef5731fSOliver Tappe     r[0] = ESC;
249*aef5731fSOliver Tappe     r[1] = '(';
250*aef5731fSOliver Tappe     r[2] = 'B';
251*aef5731fSOliver Tappe     /* conv->ostate = 0; will be done by the caller */
252*aef5731fSOliver Tappe     return 3;
253*aef5731fSOliver Tappe   } else
254*aef5731fSOliver Tappe     return 0;
255*aef5731fSOliver Tappe }
256*aef5731fSOliver Tappe 
257*aef5731fSOliver Tappe #undef STATE_JISX0212
258*aef5731fSOliver Tappe #undef STATE_JISX0208
259*aef5731fSOliver Tappe #undef STATE_JISX0201ROMAN
260*aef5731fSOliver Tappe #undef STATE_ASCII
261