xref: /PHP-7.2/ext/mbstring/libmbfl/mbfl/mbfilter.h (revision bf5a802f)
1 /* charset=UTF-8
2  * vim: encoding=utf-8:
3  * */
4 
5 /*
6  * "streamable kanji code filter and converter"
7  *
8  * Copyright (c) 1998,1999,2000,2001 HappySize, Inc. All rights reserved.
9  *
10  * This software is released under the GNU Lesser General Public License.
11  * (Version 2.1, February 1999)
12  * Please read the following detail of the licence (in japanese).
13  *
14  * ◆使用許諾条件◆
15  *
16  * このソフトウェアは株式会社ハッピーサイズによって開発されました。株式会社ハッ
17  * ピーサイズは、著作権法および万国著作権条約の定めにより、このソフトウェアに関
18  * するすべての権利を留保する権利を持ち、ここに行使します。株式会社ハッピーサイ
19  * ズは以下に明記した条件に従って、このソフトウェアを使用する排他的ではない権利
20  * をお客様に許諾します。何人たりとも、以下の条件に反してこのソフトウェアを使用
21  * することはできません。
22  *
23  * このソフトウェアを「GNU Lesser General Public License (Version 2.1, February
24  * 1999)」に示された条件で使用することを、全ての方に許諾します。「GNU Lesser
25  * General Public License」を満たさない使用には、株式会社ハッピーサイズから書面
26  * による許諾を得る必要があります。
27  *
28  * 「GNU Lesser General Public License」の全文は以下のウェブページから取得でき
29  * ます。「GNU Lesser General Public License」とは、これまでLibrary General
30  * Public Licenseと呼ばれていたものです。
31  *     http://www.gnu.org/ --- GNUウェブサイト
32  *     http://www.gnu.org/copyleft/lesser.html --- ライセンス文面
33  * このライセンスの内容がわからない方、守れない方には使用を許諾しません。
34  *
35  * しかしながら、当社とGNUプロジェクトとの特定の関係を示唆または主張するもので
36  * はありません。
37  *
38  * ◆保証内容◆
39  *
40  * このソフトウェアは、期待された動作・機能・性能を持つことを目標として設計され
41  * 開発されていますが、これを保証するものではありません。このソフトウェアは「こ
42  * のまま」の状態で提供されており、たとえばこのソフトウェアの有用性ないし特定の
43  * 目的に合致することといった、何らかの保証内容が、明示されたり暗黙に示されてい
44  * る場合であっても、その保証は無効です。このソフトウェアを使用した結果ないし使
45  * 用しなかった結果によって、直接あるいは間接に受けた身体的な傷害、財産上の損害
46  * 、データの損失あるいはその他の全ての損害については、その損害の可能性が使用者
47  * 、当社あるいは第三者によって警告されていた場合であっても、当社はその損害の賠
48  * 償および補填を行いません。この規定は他の全ての、書面上または書面に無い保証・
49  * 契約・規定に優先します。
50  *
51  * ◆著作権者の連絡先および使用条件についての問い合わせ先◆
52  *
53  * 〒102-0073
54  * 東京都千代田区九段北1-13-5日本地所第一ビル4F
55  * 株式会社ハッピーサイズ
56  * Phone: 03-3512-3655, Fax: 03-3512-3656
57  * Email: sales@happysize.co.jp
58  * Web: http://happysize.com/
59  *
60  * ◆著者◆
61  *
62  * 金本 茂 <sgk@happysize.co.jp>
63  *
64  * ◆履歴◆
65  *
66  * 1998/11/10 sgk implementation in C++
67  * 1999/4/25  sgk Cで書きなおし。
68  * 1999/4/26  sgk 入力フィルタを実装。漢字コードを推定しながらフィルタを追加。
69  * 1999/6/??      Unicodeサポート。
70  * 1999/6/22  sgk ライセンスをLGPLに変更。
71  *
72  */
73 
74 /*
75  * Unicode support
76  *
77  * Portions copyright (c) 1999,2000,2001 by the PHP3 internationalization team.
78  * All rights reserved.
79  *
80  */
81 
82 /*
83  *
84  * streamable kanji code filter and converter
85  *    mbfl : Multi Byte FiLter Liblary
86  *
87  */
88 
89 #ifndef MBFL_MBFILTER_H
90 #define MBFL_MBFILTER_H
91 
92 #include "mbfl_defs.h"
93 #include "mbfl_consts.h"
94 #include "mbfl_allocators.h"
95 #include "mbfl_encoding.h"
96 #include "mbfl_language.h"
97 #include "mbfl_string.h"
98 #include "mbfl_convert.h"
99 #include "mbfl_ident.h"
100 
101 /*
102  * version information
103  */
104 #define MBFL_VERSION_MAJOR 1
105 #define MBFL_VERSION_MINOR 3
106 #define MBFL_VERSION_TEENY 2
107 
108 /*
109  * convert filter
110  */
111 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_NONE 0
112 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_CHAR 1
113 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_LONG 2
114 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_ENTITY 3
115 
116 /*
117  * convenience macros
118  */
119 #ifndef MIN
120 #define MIN(a,b) ((a)<(b)?(a):(b))
121 #endif
122 
123 /*
124  * buffering converter
125  */
126 typedef struct _mbfl_buffer_converter mbfl_buffer_converter;
127 
128 struct _mbfl_buffer_converter {
129 	mbfl_convert_filter *filter1;
130 	mbfl_convert_filter *filter2;
131 	mbfl_memory_device device;
132 	const mbfl_encoding *from;
133 	const mbfl_encoding *to;
134 };
135 
136 MBFLAPI extern mbfl_buffer_converter * mbfl_buffer_converter_new(enum mbfl_no_encoding from, enum mbfl_no_encoding to, int buf_initsz);
137 MBFLAPI extern mbfl_buffer_converter * mbfl_buffer_converter_new2(const mbfl_encoding *from, const mbfl_encoding *to, int buf_initsz);
138 MBFLAPI extern void mbfl_buffer_converter_delete(mbfl_buffer_converter *convd);
139 MBFLAPI extern void mbfl_buffer_converter_reset(mbfl_buffer_converter *convd);
140 MBFLAPI extern int mbfl_buffer_converter_illegal_mode(mbfl_buffer_converter *convd, int mode);
141 MBFLAPI extern int mbfl_buffer_converter_illegal_substchar(mbfl_buffer_converter *convd, int substchar);
142 MBFLAPI extern int mbfl_buffer_converter_strncat(mbfl_buffer_converter *convd, const unsigned char *p, int n);
143 MBFLAPI extern int mbfl_buffer_converter_feed(mbfl_buffer_converter *convd, mbfl_string *string);
144 MBFLAPI extern int mbfl_buffer_converter_feed2(mbfl_buffer_converter *convd, mbfl_string *string, int *loc);
145 MBFLAPI extern int mbfl_buffer_converter_flush(mbfl_buffer_converter *convd);
146 MBFLAPI extern mbfl_string * mbfl_buffer_converter_getbuffer(mbfl_buffer_converter *convd, mbfl_string *result);
147 MBFLAPI extern mbfl_string * mbfl_buffer_converter_result(mbfl_buffer_converter *convd, mbfl_string *result);
148 MBFLAPI extern mbfl_string * mbfl_buffer_converter_feed_result(mbfl_buffer_converter *convd, mbfl_string *string, mbfl_string *result);
149 MBFLAPI extern int mbfl_buffer_illegalchars(mbfl_buffer_converter *convd);
150 
151 /*
152  * encoding detector
153  */
154 typedef struct _mbfl_encoding_detector mbfl_encoding_detector;
155 
156 struct _mbfl_encoding_detector {
157 	mbfl_identify_filter **filter_list;
158 	int filter_list_size;
159 	int strict;
160 };
161 
162 MBFLAPI extern mbfl_encoding_detector * mbfl_encoding_detector_new(enum mbfl_no_encoding *elist, int elistsz, int strict);
163 MBFLAPI extern mbfl_encoding_detector * mbfl_encoding_detector_new2(const mbfl_encoding **elist, int elistsz, int strict);
164 MBFLAPI extern void mbfl_encoding_detector_delete(mbfl_encoding_detector *identd);
165 MBFLAPI extern int mbfl_encoding_detector_feed(mbfl_encoding_detector *identd, mbfl_string *string);
166 MBFLAPI extern enum mbfl_no_encoding mbfl_encoding_detector_judge(mbfl_encoding_detector *identd);
167 MBFLAPI extern const mbfl_encoding *mbfl_encoding_detector_judge2(mbfl_encoding_detector *identd);
168 
169 
170 /*
171  * encoding converter
172  */
173 MBFLAPI extern mbfl_string *
174 mbfl_convert_encoding(mbfl_string *string, mbfl_string *result, enum mbfl_no_encoding toenc);
175 
176 
177 /*
178  * identify encoding
179  */
180 MBFLAPI extern const mbfl_encoding *
181 mbfl_identify_encoding(mbfl_string *string, enum mbfl_no_encoding *elist, int elistsz, int strict);
182 
183 MBFLAPI extern const mbfl_encoding *
184 mbfl_identify_encoding2(mbfl_string *string, const mbfl_encoding **elist, int elistsz, int strict);
185 /*
186  * strlen
187  */
188 MBFLAPI extern int
189 mbfl_strlen(mbfl_string *string);
190 
191 /*
192  * oddlen
193  */
194 MBFLAPI extern int
195 mbfl_oddlen(mbfl_string *string);
196 
197 /*
198  * strpos
199  */
200 MBFLAPI extern int
201 mbfl_strpos(mbfl_string *haystack, mbfl_string *needle, int offset, int reverse);
202 
203 
204 /*
205  * substr_count
206  */
207 MBFLAPI extern int
208 mbfl_substr_count(mbfl_string *haystack, mbfl_string *needle);
209 
210 /*
211  * substr
212  */
213 MBFLAPI extern mbfl_string *
214 mbfl_substr(mbfl_string *string, mbfl_string *result, int from, int length);
215 
216 /*
217  * strcut
218  */
219 MBFLAPI extern mbfl_string *
220 mbfl_strcut(mbfl_string *string, mbfl_string *result, int from, int length);
221 
222 /*
223  *  strwidth
224  */
225 MBFLAPI extern int
226 mbfl_strwidth(mbfl_string *string);
227 
228 /*
229  *  strimwidth
230  */
231 MBFLAPI extern mbfl_string *
232 mbfl_strimwidth(mbfl_string *string, mbfl_string *marker, mbfl_string *result, int from, int width);
233 
234 /*
235  * MIME header encode
236  */
237 struct mime_header_encoder_data;	/* forward declaration */
238 
239 MBFLAPI extern struct mime_header_encoder_data *
240 mime_header_encoder_new(
241     enum mbfl_no_encoding incode,
242     enum mbfl_no_encoding outcode,
243     enum mbfl_no_encoding encoding);
244 
245 MBFLAPI extern void
246 mime_header_encoder_delete(struct mime_header_encoder_data *pe);
247 
248 MBFLAPI extern int
249 mime_header_encoder_feed(int c, struct mime_header_encoder_data *pe);
250 
251 MBFLAPI extern mbfl_string *
252 mime_header_encoder_result(struct mime_header_encoder_data *pe, mbfl_string *result);
253 
254 MBFLAPI extern mbfl_string *
255 mbfl_mime_header_encode(
256     mbfl_string *string, mbfl_string *result,
257     enum mbfl_no_encoding outcode,
258     enum mbfl_no_encoding encoding,
259     const char *linefeed,
260     int indent);
261 
262 /*
263  * MIME header decode
264  */
265 struct mime_header_decoder_data;	/* forward declaration */
266 
267 MBFLAPI extern struct mime_header_decoder_data *
268 mime_header_decoder_new(enum mbfl_no_encoding outcode);
269 
270 MBFLAPI extern void
271 mime_header_decoder_delete(struct mime_header_decoder_data *pd);
272 
273 MBFLAPI extern int
274 mime_header_decoder_feed(int c, struct mime_header_decoder_data *pd);
275 
276 MBFLAPI extern mbfl_string *
277 mime_header_decoder_result(struct mime_header_decoder_data *pd, mbfl_string *result);
278 
279 MBFLAPI extern mbfl_string *
280 mbfl_mime_header_decode(
281     mbfl_string *string,
282     mbfl_string *result,
283     enum mbfl_no_encoding outcode);
284 
285 /*
286  * convert HTML numeric entity
287  */
288 MBFLAPI extern mbfl_string *
289 mbfl_html_numeric_entity(mbfl_string *string, mbfl_string *result, int *convmap, int mapsize, int type);
290 
291 /*
292  * convert of harfwidth and fullwidth for japanese
293  */
294 MBFLAPI extern mbfl_string *
295 mbfl_ja_jp_hantozen(mbfl_string *string, mbfl_string *result, int mode);
296 
297 #endif	/* MBFL_MBFILTER_H */
298