1 /* charset=UTF-8 2 * vim: encoding=utf-8: 3 * */ 4 5 /* 6 * "streamable kanji code filter and converter" 7 * 8 * Copyright (c) 1998,1999,2000,2001 HappySize, Inc. All rights reserved. 9 * 10 * This software is released under the GNU Lesser General Public License. 11 * (Version 2.1, February 1999) 12 * Please read the following detail of the licence (in japanese). 13 * 14 * ◆使用許諾条件◆ 15 * 16 * このソフトウェアは株式会社ハッピーサイズによって開発されました。株式会社ハッ 17 * ピーサイズは、著作権法および万国著作権条約の定めにより、このソフトウェアに関 18 * するすべての権利を留保する権利を持ち、ここに行使します。株式会社ハッピーサイ 19 * ズは以下に明記した条件に従って、このソフトウェアを使用する排他的ではない権利 20 * をお客様に許諾します。何人たりとも、以下の条件に反してこのソフトウェアを使用 21 * することはできません。 22 * 23 * このソフトウェアを「GNU Lesser General Public License (Version 2.1, February 24 * 1999)」に示された条件で使用することを、全ての方に許諾します。「GNU Lesser 25 * General Public License」を満たさない使用には、株式会社ハッピーサイズから書面 26 * による許諾を得る必要があります。 27 * 28 * 「GNU Lesser General Public License」の全文は以下のウェブページから取得でき 29 * ます。「GNU Lesser General Public License」とは、これまでLibrary General 30 * Public Licenseと呼ばれていたものです。 31 * http://www.gnu.org/ --- GNUウェブサイト 32 * http://www.gnu.org/copyleft/lesser.html --- ライセンス文面 33 * このライセンスの内容がわからない方、守れない方には使用を許諾しません。 34 * 35 * しかしながら、当社とGNUプロジェクトとの特定の関係を示唆または主張するもので 36 * はありません。 37 * 38 * ◆保証内容◆ 39 * 40 * このソフトウェアは、期待された動作・機能・性能を持つことを目標として設計され 41 * 開発されていますが、これを保証するものではありません。このソフトウェアは「こ 42 * のまま」の状態で提供されており、たとえばこのソフトウェアの有用性ないし特定の 43 * 目的に合致することといった、何らかの保証内容が、明示されたり暗黙に示されてい 44 * る場合であっても、その保証は無効です。このソフトウェアを使用した結果ないし使 45 * 用しなかった結果によって、直接あるいは間接に受けた身体的な傷害、財産上の損害 46 * 、データの損失あるいはその他の全ての損害については、その損害の可能性が使用者 47 * 、当社あるいは第三者によって警告されていた場合であっても、当社はその損害の賠 48 * 償および補填を行いません。この規定は他の全ての、書面上または書面に無い保証・ 49 * 契約・規定に優先します。 50 * 51 * ◆著作権者の連絡先および使用条件についての問い合わせ先◆ 52 * 53 * 〒102-0073 54 * 東京都千代田区九段北1-13-5日本地所第一ビル4F 55 * 株式会社ハッピーサイズ 56 * Phone: 03-3512-3655, Fax: 03-3512-3656 57 * Email: sales@happysize.co.jp 58 * Web: http://happysize.com/ 59 * 60 * ◆著者◆ 61 * 62 * 金本 茂 <sgk@happysize.co.jp> 63 * 64 * ◆履歴◆ 65 * 66 * 1998/11/10 sgk implementation in C++ 67 * 1999/4/25 sgk Cで書きなおし。 68 * 1999/4/26 sgk 入力フィルタを実装。漢字コードを推定しながらフィルタを追加。 69 * 1999/6/?? Unicodeサポート。 70 * 1999/6/22 sgk ライセンスをLGPLに変更。 71 * 72 */ 73 74 /* 75 * Unicode support 76 * 77 * Portions copyright (c) 1999,2000,2001 by the PHP3 internationalization team. 78 * All rights reserved. 79 * 80 */ 81 82 /* 83 * 84 * streamable kanji code filter and converter 85 * mbfl : Multi Byte FiLter Liblary 86 * 87 */ 88 89 #ifndef MBFL_MBFILTER_H 90 #define MBFL_MBFILTER_H 91 92 #include "mbfl_defs.h" 93 #include "mbfl_consts.h" 94 #include "mbfl_allocators.h" 95 #include "mbfl_encoding.h" 96 #include "mbfl_language.h" 97 #include "mbfl_string.h" 98 #include "mbfl_convert.h" 99 #include "mbfl_ident.h" 100 101 /* 102 * version information 103 */ 104 #define MBFL_VERSION_MAJOR 1 105 #define MBFL_VERSION_MINOR 3 106 #define MBFL_VERSION_TEENY 2 107 108 /* 109 * convert filter 110 */ 111 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_NONE 0 112 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_CHAR 1 113 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_LONG 2 114 #define MBFL_OUTPUTFILTER_ILLEGAL_MODE_ENTITY 3 115 116 /* 117 * convenience macros 118 */ 119 #ifndef MIN 120 #define MIN(a,b) ((a)<(b)?(a):(b)) 121 #endif 122 123 /* 124 * buffering converter 125 */ 126 typedef struct _mbfl_buffer_converter mbfl_buffer_converter; 127 128 struct _mbfl_buffer_converter { 129 mbfl_convert_filter *filter1; 130 mbfl_convert_filter *filter2; 131 mbfl_memory_device device; 132 const mbfl_encoding *from; 133 const mbfl_encoding *to; 134 }; 135 136 MBFLAPI extern mbfl_buffer_converter * mbfl_buffer_converter_new(enum mbfl_no_encoding from, enum mbfl_no_encoding to, int buf_initsz); 137 MBFLAPI extern mbfl_buffer_converter * mbfl_buffer_converter_new2(const mbfl_encoding *from, const mbfl_encoding *to, int buf_initsz); 138 MBFLAPI extern void mbfl_buffer_converter_delete(mbfl_buffer_converter *convd); 139 MBFLAPI extern void mbfl_buffer_converter_reset(mbfl_buffer_converter *convd); 140 MBFLAPI extern int mbfl_buffer_converter_illegal_mode(mbfl_buffer_converter *convd, int mode); 141 MBFLAPI extern int mbfl_buffer_converter_illegal_substchar(mbfl_buffer_converter *convd, int substchar); 142 MBFLAPI extern int mbfl_buffer_converter_strncat(mbfl_buffer_converter *convd, const unsigned char *p, int n); 143 MBFLAPI extern int mbfl_buffer_converter_feed(mbfl_buffer_converter *convd, mbfl_string *string); 144 MBFLAPI extern int mbfl_buffer_converter_feed2(mbfl_buffer_converter *convd, mbfl_string *string, int *loc); 145 MBFLAPI extern int mbfl_buffer_converter_flush(mbfl_buffer_converter *convd); 146 MBFLAPI extern mbfl_string * mbfl_buffer_converter_getbuffer(mbfl_buffer_converter *convd, mbfl_string *result); 147 MBFLAPI extern mbfl_string * mbfl_buffer_converter_result(mbfl_buffer_converter *convd, mbfl_string *result); 148 MBFLAPI extern mbfl_string * mbfl_buffer_converter_feed_result(mbfl_buffer_converter *convd, mbfl_string *string, mbfl_string *result); 149 MBFLAPI extern int mbfl_buffer_illegalchars(mbfl_buffer_converter *convd); 150 151 /* 152 * encoding detector 153 */ 154 typedef struct _mbfl_encoding_detector mbfl_encoding_detector; 155 156 struct _mbfl_encoding_detector { 157 mbfl_identify_filter **filter_list; 158 int filter_list_size; 159 int strict; 160 }; 161 162 MBFLAPI extern mbfl_encoding_detector * mbfl_encoding_detector_new(enum mbfl_no_encoding *elist, int elistsz, int strict); 163 MBFLAPI extern mbfl_encoding_detector * mbfl_encoding_detector_new2(const mbfl_encoding **elist, int elistsz, int strict); 164 MBFLAPI extern void mbfl_encoding_detector_delete(mbfl_encoding_detector *identd); 165 MBFLAPI extern int mbfl_encoding_detector_feed(mbfl_encoding_detector *identd, mbfl_string *string); 166 MBFLAPI extern enum mbfl_no_encoding mbfl_encoding_detector_judge(mbfl_encoding_detector *identd); 167 MBFLAPI extern const mbfl_encoding *mbfl_encoding_detector_judge2(mbfl_encoding_detector *identd); 168 169 170 /* 171 * encoding converter 172 */ 173 MBFLAPI extern mbfl_string * 174 mbfl_convert_encoding(mbfl_string *string, mbfl_string *result, enum mbfl_no_encoding toenc); 175 176 177 /* 178 * identify encoding 179 */ 180 MBFLAPI extern const mbfl_encoding * 181 mbfl_identify_encoding(mbfl_string *string, enum mbfl_no_encoding *elist, int elistsz, int strict); 182 183 MBFLAPI extern const mbfl_encoding * 184 mbfl_identify_encoding2(mbfl_string *string, const mbfl_encoding **elist, int elistsz, int strict); 185 /* 186 * strlen 187 */ 188 MBFLAPI extern int 189 mbfl_strlen(mbfl_string *string); 190 191 /* 192 * oddlen 193 */ 194 MBFLAPI extern int 195 mbfl_oddlen(mbfl_string *string); 196 197 /* 198 * strpos 199 */ 200 MBFLAPI extern int 201 mbfl_strpos(mbfl_string *haystack, mbfl_string *needle, int offset, int reverse); 202 203 204 /* 205 * substr_count 206 */ 207 MBFLAPI extern int 208 mbfl_substr_count(mbfl_string *haystack, mbfl_string *needle); 209 210 /* 211 * substr 212 */ 213 MBFLAPI extern mbfl_string * 214 mbfl_substr(mbfl_string *string, mbfl_string *result, int from, int length); 215 216 /* 217 * strcut 218 */ 219 MBFLAPI extern mbfl_string * 220 mbfl_strcut(mbfl_string *string, mbfl_string *result, int from, int length); 221 222 /* 223 * strwidth 224 */ 225 MBFLAPI extern int 226 mbfl_strwidth(mbfl_string *string); 227 228 /* 229 * strimwidth 230 */ 231 MBFLAPI extern mbfl_string * 232 mbfl_strimwidth(mbfl_string *string, mbfl_string *marker, mbfl_string *result, int from, int width); 233 234 /* 235 * MIME header encode 236 */ 237 struct mime_header_encoder_data; /* forward declaration */ 238 239 MBFLAPI extern struct mime_header_encoder_data * 240 mime_header_encoder_new( 241 enum mbfl_no_encoding incode, 242 enum mbfl_no_encoding outcode, 243 enum mbfl_no_encoding encoding); 244 245 MBFLAPI extern void 246 mime_header_encoder_delete(struct mime_header_encoder_data *pe); 247 248 MBFLAPI extern int 249 mime_header_encoder_feed(int c, struct mime_header_encoder_data *pe); 250 251 MBFLAPI extern mbfl_string * 252 mime_header_encoder_result(struct mime_header_encoder_data *pe, mbfl_string *result); 253 254 MBFLAPI extern mbfl_string * 255 mbfl_mime_header_encode( 256 mbfl_string *string, mbfl_string *result, 257 enum mbfl_no_encoding outcode, 258 enum mbfl_no_encoding encoding, 259 const char *linefeed, 260 int indent); 261 262 /* 263 * MIME header decode 264 */ 265 struct mime_header_decoder_data; /* forward declaration */ 266 267 MBFLAPI extern struct mime_header_decoder_data * 268 mime_header_decoder_new(enum mbfl_no_encoding outcode); 269 270 MBFLAPI extern void 271 mime_header_decoder_delete(struct mime_header_decoder_data *pd); 272 273 MBFLAPI extern int 274 mime_header_decoder_feed(int c, struct mime_header_decoder_data *pd); 275 276 MBFLAPI extern mbfl_string * 277 mime_header_decoder_result(struct mime_header_decoder_data *pd, mbfl_string *result); 278 279 MBFLAPI extern mbfl_string * 280 mbfl_mime_header_decode( 281 mbfl_string *string, 282 mbfl_string *result, 283 enum mbfl_no_encoding outcode); 284 285 /* 286 * convert HTML numeric entity 287 */ 288 MBFLAPI extern mbfl_string * 289 mbfl_html_numeric_entity(mbfl_string *string, mbfl_string *result, int *convmap, int mapsize, int type); 290 291 /* 292 * convert of harfwidth and fullwidth for japanese 293 */ 294 MBFLAPI extern mbfl_string * 295 mbfl_ja_jp_hantozen(mbfl_string *string, mbfl_string *result, int mode); 296 297 #endif /* MBFL_MBFILTER_H */ 298