Re: EUC? ( No.13 ) |
- 日時: 2004/04/07 19:38
- 名前: hachiya
- 出張行ってたりして、まだHotSyncの環境が作れてません
> 2.EUCコードだと判断したら、一時的な格納領域を確保して、 > もとの文字列をEUCコードに変換したものを格納 SJISに変換ですよね?
この手のプログラム、昔、何度も書いた記憶があります。 日本語化された発展途上なワークステーションを使ってたものですから。
JISへのエスケープシーケンス: ESC $ B (0x1B, 0x24, 0x42)か ESC $ @ (0x1B, 0x24, 0x40) を見たらJIS->SJISモード(安直な実装はモード中のキャラクタの最上位ビットを立てて、EUC->SJISの処理ルーチンへ :-) )
ASCIIへのエスケープシーケンス: ESC ( B (0x1B, 0x28, 0x42) かESC ( J (0x1B, 0x28, 0x4A) を見たら、無変換モードというのは大変でしょうか? (エスケープシーケンスはモードチェンジなので、前と同じものが来たときは無視してよい と言うのは釈迦に説法ですね)
あっ、エスケープシーケンスがそろって来ることが当てにできないのかな? Mac OS XのSafariも(バッファの大きさの都合?)で途中から化けてしまうことがあります。 (漢字の2バイトが分かれてしまうためだと思います)
|
Re: EUC? ( No.14 ) |
- 日時: 2004/04/08 07:57
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- 参照: http://www5f.biglobe.ne.jp/~T-Pilot/PalmWares/EUC_/
- hachiyaさん 自分で組まれたらいかが?
なんてね
いろいろ勉強しました 今の構想は、 第一段階 FastDetect 1.エスケープシーケンスが出たら、ISO-2022JP(JIS)のシーケンスとマッチしているかチェック->yes:isJIS、no:unknown(ISO-2022の他のエンコード) 2.0x80-0x8dもしくは0x90-0xA0の範囲のコードが出現したら->ShiftJIS 3.全てが0x7f以下であればASCII 3.上記1、2、3に引っかからなかったら、Shift-JISかEUCかPalmLatinなのでSlowDetectへ
第二段階 SlowDetect 1.Shift-JISのコードにマッチしているかをcheck(全てが半角カナ文字対策) yes:Shift-JIS No:次へ 2.EUCコードにマッチしているかをcheck yes:EUC No:unknown(PalmLatinか、PalmLatinとShiftJISの混在)
で、 単に描画であれば文字列を変換したものにすげかえ フィールドの文字列セットであれば、文字列そのものを変換
だいぶ重くなりますが、DAで切り替えられるようにしておけばまあ良いかと この方法のネックは、PalmLatinと判断されるのが一番最後になってしまうこと...
半角カナって邪魔ですね
|
Re: Enc? ( No.15 ) |
- 日時: 2004/04/19 09:40
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- 参照: http://www5f.biglobe.ne.jp/~T-Pilot/PalmWares/Enc_/
- 大幅アップデートです
ほぼ実用に耐えるかと思います http://www5f.biglobe.ne.jp/~T-Pilot/PalmWares/Enc_/
以前のもの、全て削除してくださいね
Enc_Hack.prc エンコーディング自動判定のHack本体 Enc_SwDA.prc ON/OFF用のDA Enc_ToJisDA.prc 文字コードをJISに変換するDA
EncHackは文字列描画だけでなく、メモ帳などのデータの自動判定と変換をサポートしています。 無理やりJISやEUCなデータを書き込んで見てください といっても、それは大変なので、 EucAndJisMemoPadData.mpa はPalmDeskTopのMempPad用データです PalmDeskTopでインポートしてHotSyncしてみてください
Enc_ToJisDAは単体でも動作します 変換したい文章を入力したフィールドをアクティブにしてEnc_ToJisDAを実行
テスト用にはてなダイアリーをはじめました http://d.hatena.ne.jp/T-Pilot/ このページはEUCなのですが、PalmWebProから記入、修正などを行っています
でもって、Starter-STRT.PRCはテスト用のアプリケーションです どんな動作するか試してみてくださいな ↑差し替えました(社外秘文章でした )見なかったことにしてくださいね
|
Re: Enc? ( No.16 ) |
- 日時: 2004/04/13 20:07
- 名前: ミカン
- 参照: http://www.geocities.jp/visor_mac_room/
- こんばんは。
>>15 はてなダイアリーにコメント書いてみました。 ちょっと文字化けがはいりました。 自分のはてなダイアリーで日記を書いて登録しよとすると、なぜか登録できませんでした(よくわからず)。 ログインしているはずが、すぐにゲストさんになってしまいます。何がいけないのでしょうかね?
EucAndJisMemoPadData.mpa を Mac な環境で取り扱えませんでした。PalmDesktop の読み込みはできず、エディターで開いて文字化けしていることを確認はできたのですが、メモ帳にコピー&ペーストできませんでした。 ただ、はてなダイアリーを EncHackoff な状態で閲覧し文字化け状態のページを確認したあと、EncSwDA の Auto を選択してメニューのHistory から今のEUC な文字化けページを選択してやると、文字化けが解消されることが分かります。これがメモ帳での自動判定と同じ機能を意味しているのかと思っていますが、違いますか(^-^;;; このT-Pilot BBS を EncHack on の状態で閲覧すると、文字化け(豆腐など)しているところがありました。 サイトのエンコードによって、EncSwDAで切替えて使う方法で対処する ということですよね。 あるいは、自動判定ということから、本来は切替えなくてもいいという 仕様なのでしょうか?
Starter-STRT、どのような発展をするのかな いろいろなエンコードデータを表示できるマルチ閲覧ソフト。
|
Re: Enc? ( No.17 ) |
- 日時: 2004/04/13 20:40
- 名前: ミカン <classic400@mac.com>
- test
WebProゥ蹙ncHackOn眉・ヤ統・~AEncToJisDAナ"マ`キオトワ拳B
変換、忘れました(これはMacから修正) Shift-JIS なこのページに WebPro から書き込む場合、EncHack On で日本語入力し EncToJISDA で変換していいものか、ということを確認したかったのです。 ToJISDAは機能的にEncToJisDA に含まれてしまっているのですよね。
|
[Enc?***]の解説 ( No.18 ) |
- 日時: 2004/04/14 22:11
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- 参照: http://www5f.biglobe.ne.jp/~T-Pilot/zatugaku/Bangai-No.1.html
- 突然ですが 番外編第一回です
[Enc?***]の解説 http://www5f.biglobe.ne.jp/~T-Pilot/zatugaku/Bangai-No.1.html
なにをやっているか判らないと気持ち悪いでしょ
|
JIS (iso-2022-jp) のページ ( No.19 ) |
- 日時: 2004/04/21 00:51
- 名前: たー
- JIS コード(ISO-2022-JP) のページでいつも巡回しているのは
セキュリティホールメモ (http://www.st.ryukoku.ac.jp/%7Ekjm/security/memo/index.html) 日本のLinux情報 (http://www.linux.or.jp/) などがあります。Palm系のサイトだとJISコードは少ないですが、UNIX系のサイトだとJISのページの方が多いと思います。 ということで、JISコードのサポートもぜひ検討をお願いしますです。
ISO-2022-JPはかなり特徴のあるコードなので、真っ先に判定処理をして、それから Shift_JIS or EUC_JP の判定処理をすればいいんじゃないでしょうか。nkf や kqc などの著名な文字コードコンバータのソースを参考にされてもよいかと思います。
|
JIS (iso-2022-jp) のページ ( No.20 ) |
- 日時: 2004/04/21 08:11
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- たーさん はじめまして
ToJisDAのおまけとしてEnc?Hack公開しました Historyから辿って、ToJisDAを試してみてくださいね
JISコードのページ、何とか内容を読み取れる程度には見れるでしょ? いちおう、ある程度の対応はしています
ただ、処理速度低下を懸念して、現在の構成に
JISコードの処理は難しいんですよ Palm上での文字描画処理のお作法と組み合わされると...
エスケープシーケンスのおかげで、 ・文字列のバイト数と文字数が一致しない ・行がまたがってしまうとエスケープシーケンスが落ちてしまうので、 文字列を最後までスキャンして、最初に出てきたエスケープシーケンスから、 現在のステータスを推測しなくてはいけない (切り出された文字列を渡されたらお手上げ)
文字入力フィールドについては、文字列全体が渡されるので、ほぼきちんと処理できますが、 文字列描画関数は、文字列中の何文字かを切り出して渡されることが多いので、 難しいですね
Hackは前後関係を一切知らされずに動作しなくてはいけないので Hackで完全に解決するにはちょっと難しいです
ToJisDAのおまけなので勘弁ください
|
Re: IS (iso-2022-jp) のページ ( No.21 ) |
- 日時: 2004/04/21 19:13
- 名前: たー
- ToJisDA といっしょに、Enc? を入れてみましたが、JIS コードのページは文字化けしたままでした。
Hack の導入にミスっているのか、CJK-OS では Hack の作用が利かないのか、原因は不明です……。 JIS コードのベージは Xiino に頼ることにします でも、Xiino (OS5対応版) はハイレゾ対応じゃないし、ワイド画面も対応してないので、到底 $24.99 を払う価値があるとは思えませんが
|
Re: Enc? ( No.22 ) |
- 日時: 2004/04/21 21:36
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- 参照: http://www5f.biglobe.ne.jp/~T-Pilot/zatugaku/Bangai-No.1.html
- >>21
EUCのページはどうですか? http://itpro.nikkeibp.co.jp/ ところで、CJKOSって文字コードの判別を行う設定ありませんでしたっけ? JISは対応していないのかな?
|
Re: Enc? ( No.23 ) |
- 日時: 2004/04/21 22:40
- 名前: たー
- EUC のサイトは Enc? なしで見られます。Yahoo! Japan なども問題なしです。
CJK-OS は漢字コード検出機能があるんですが、ISO-2022 には対応してませんです
ISO-2022 に対応すれば中文 (ISO-2022-CN) 、日本語 (ISO-2022-JP)、ハングル (ISO-2022-KR) が共存できるはずですが、いろいろ事情があるのでしょうね。
|
Re: Enc? ( No.24 ) |
- 日時: 2004/04/22 07:29
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- >>23
多分ですが、CJKOSの文字コード自動認識のオプションを外すと、 Enc?Hackが動作するのではないかと... CJKOSもAPIを置き換えていると思われますので
|
Re: Enc? ( No.25 ) |
- 日時: 2004/04/22 17:19
- 名前: たー
- 実は、Enc? SW DA で 機能を On にするのを忘れていました:-)
Auto を選んで Apply ボタンを押せば JIS コードも半分ぐらいは表示されます。 なお、CJK-OS の Smart Detect Char Set をON/OFFどちらにしてても大丈夫のようです。
残念ながら、現状の Enc? の JIS コード解釈機能では、半分ぐらい元のコードが残ってしまうので、実用的とは言い難いですね。Hack で JIS コードを変換するという試み自体に無理があると思うので、仕方ないでしょう。 やはり Web ブラウザ自体が JIS コードを認識するのが正しいアプローチでしょうね。その面では Xiino にがんばってもらわないと……。
|
Re: Enc? ( No.26 ) |
- 日時: 2004/04/23 09:07
- 名前: sekino <sekino@mtb.biglobe.ne.jp>
- 参照: http://www5f.biglobe.ne.jp/~T-Pilot/PalmWares/DlbH/
- ひとつ、JISコードの難しい点が見つかりました
長音”ー”はJISコードに直してASCIIで表現すると”!<”になるんですね htmlに埋め込まれると、タグの表現"<"とぶつかるので、 WebProはタグの開始と判断するようです
解決するには、部分的に渡される文字列から全文を取得し、 html文章の解釈を行わなくてはいけません
あと、エンコードが混在するドキュメントもありますので、 段落ごとの解釈を行わなくてはいけないかもしれません
何とかしてみようかと思ってごそごそ調べていたのですが、 深追いしないことにします
文字列操作、構文解釈系は苦手なので
あ、どこかにエンコード変換のサーバを立てれば良いのかな? こっちのほうが早かったりして... 調べてみようっと
ところで、CJKOSってtsPatchあてられるんですか? あと、y-FntS.prcは? 両者が使えればXiinoもなんとか実用になるかも
|
Re: Enc? ( No.27 ) |
- 日時: 2004/04/26 23:40
- 名前: たー
- >ところで、CJKOSってtsPatchあてられるんですか?
>あと、y-FntS.prcは?
tsPatch は以前試してみましたが、J-OSがないというメッセージが出て使えませんでした。 y-Fnts は試していませんが、tsPatch必須ということなので、動かないと思います。
Xiino はワイド画面に対応していないのがかなり痛いですね。 フォントを小さくしても、ワイドが使えないのでは、あまり実用的でないかも…。 ワイド & ハイレゾ対応になるのに期待しましょう。
|
Re: Enc? ( No.28 ) |
- 日時: 2004/04/28 02:07
- 名前: ミカン
- 参照: http://www.geocities.jp/visor_mac_room/
- >>27 たー さん、こんばんは。
以前、Xiino を CodeDiver(1200円) で Wide 表示させた時の画像です。 http://www.geocities.jp/visor_mac_room/palm/tt3-08.html#xiino
Xiino は試用期間が過ぎたので削除済み(^_^;) WebPro + Enc? で巡回しております。
|
Re: Enc? ( No.29 ) |
- 日時: 2004/05/09 15:04
- 名前: たー
- CodeDriverを使えばワイド画面になりますか…。
でも、あまりHack系ソフトは入れなくないし、ワイド画面にするために1200円はちょっと高いのでパスですねーー。Xiinoがデフォルトでワイド画面に対応してしまうと1200円が無駄になってしまいますし:-)
|
Web Proで表示できないpageを表示? ( No.30 ) |
- 日時: 2004/08/24 11:15
- 名前: (済)
- Sekino様、いつもお世話になっております。
T|T3上でのWeb Pro+Enc?で、最近富みに増えているblogを閲覧しようとしても、例えばUTF-8で記述されたpageなどは読めない訳ですけど、KaniEdit(http://nnsh.hp.infoseek.co.jp/KaniEdit.html)ではGF Messenger(http://amsoft.minidns.net/palm/gfmsg.html)付属のUTF8変換用データベースを利用してUTF8漢字コードのファイルが読み/書きできるそうですね。
お聞きしたいのですが、Web ProからUTF-8で書かれたpageのソースをこのKaniEditに渡して、KaniEdit上で読むという事は出来るものでしょうか? ソースをそのまま表示されてもなかなか読み辛いというのはその次の問題として、link先が表示されていればDAなどでそのURLをWeb Pro側にもう一度返して再取得するという事もできますし。なんとか使えるかも。
あくまでプログラムを知らない素人の思いつきなのですが、Sekino様の創作意欲を刺激できるものであればと思い投稿してみました。 それでは失礼致します。
|
webDA ( No.31 ) |
- 日時: 2004/08/27 10:49
- 名前: (済)
- >30 に対する自己レスです。
NNsiの作者の方がwebDAというアプリを公開されています。 http://nnsh.hp.infoseek.co.jp/webDA.html 取敢えずインストールしただけなのですが、自分の考えていた物に近いものなのかと思いました。 まだ受信ファイルが30KBまでとキャラクタコードの判別が甘いとか制限があるとのことですが、上手く動作する事を期待したいと思います。
それでは失礼致します。
|
Re: Enc? ( No.32 ) |
- 日時: 2004/08/27 14:49
- 名前: sekino
- (済)さん
こんにちは ほったらかしですみません 僕のほうでも週末に少し調べてみます WebProはテキストに書き出せない+カード保存ができないのがつらいですね
|