5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

文字コード総合スレ part6

1 :デフォルトの名無しさん:2010/07/12(月) 17:24:19
プログラマーなら一度は煩わされたことのある文字コードについてのスレ。
UTF-8、ShiftJIS、JIS、EUC、Uincode、 UCS、サロゲートペア、コードポイント、文字コード判定、
合成文字、ソート、TRON、外字コード、その他について語り合いましょう。
各言語での文字列の扱いについての質問もOKです。
基本マッターリ、ささ、茶でもどうぞ。

■過去スレ
文字コード総合スレ part1 http://pc11.2ch.net/test/read.cgi/tech/1031028205/
文字コード総合スレ part2 http://pc11.2ch.net/test/read.cgi/tech/1143375639/
文字コード総合スレ part3 http://pc11.2ch.net/test/read.cgi/tech/1180250376/
文字コード総合スレ part4 http://pc11.2ch.net/test/read.cgi/tech/1228052369/
(スレ再利用)UnicodeとUTF-8の違いは? http://pc12.2ch.net/test/read.cgi/tech/1177930957/
(隔離スレ)UnicodeとUTF-8の違いは? その2 http://pc12.2ch.net/test/read.cgi/tech/1274937437/
文字コード総合スレ part5 http://pc12.2ch.net/test/read.cgi/tech/1236529563/

■前スレ1からの連絡
だれかwiki管理できる?数年単位で保守できる人連絡プリーズ。
あと紳士諸君、常に裸で靴下を心得て、マッターリ議論汁。
コードサイズ、互換性、速度等気になるなら実験して結果をdiffパッチで提出汁。変態紳士は背中で語るべし。
とりあえず次スレ立て忘れごめん。それでは逝ってみようか…


2 :1:2010/07/12(月) 17:25:18
■参考サイト
Unicode Home Page
http://www.unicode.org/
Java Character Encodings
http://www.ingrid.org/java/i18n/encoding/
euc.JP: tech docs, BeOS tools
http://euc.jp/
ISO-IR - 2.8.1 Coding systems with Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm
ISO-IR - 2.8.2 Coding Systems without Standard return
http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm
IANA: Character Sets
http://www.iana.org/assignments/character-sets
Legacy Encoding Project
http://sourceforge.jp/projects/legacy-encoding/
CP50220
森山さんの説明
http://lists.sourceforge.jp/mailman/archives/legacy-encoding-talk-ja/2006-March/000002.html
JISX4061
日本語文字列照合順番
http://www.jisc.go.jp/


3 :1:2010/07/12(月) 17:26:56
漢字袋
http://kanji.zinbun.kyoto-u.ac.jp/~yasuoka/kanjibukuro/
池田証寿
http://homepage3.nifty.com/shikeda/zatsubun.htm
SJIS2004とかJISX213系の文字コード表
http://x0213.org/codetable/
※JISCの奴は無料で閲覧できる奴じゃなくて購入したPDFでも手で書き取らされます
Windowsで扱える文字一覧(コードページ毎で良ければ)
http://www.microsoft.com/globaldev/reference/cphome.mspx
docomoの携帯コンテンツ制作者向け文字コード情報
http://www.nttdocomo.co.jp/service/imode/make/
auの携帯コンテンツ制作者向け文字コード情報
http://www.au.kddi.com/ezfactory/
SoftBank携帯コンテンツ制作者向け文字コード情報
http://creation.mb.softbank.jp/
漢字データベース
http://kanji-database.sourceforge.net/index.html


4 :1:2010/07/12(月) 17:28:10
Google Standard Unicode Emoji Mapping
http://unicode.org/~mdavis/08080r-emoji-proposal/
Proposal for Encoding Emoji Symbols/N3582
http://unicode.org/~scherer/emoji4unicode/snapshot/emoji.pdf
Emoji Symbols: Background Data
http://unicode.org/~scherer/emoji4unicode/snapshot/full.html
Amd.7のドラフト
http://std.dkuug.dk/jtc1/sc2/wg2/docs/n3580.pdf
MacOSでのShift_JISとUnicodeとのマッピング
ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/JAPANESE.TXT
MS-DOS 5.0〜WindowsXPまでのコードページ
http://msdn.microsoft.com/en-us/goglobal/cc563921.aspx
Supported Code Pages (コードページなしは変換)
http://msdn.microsoft.com/en-us/library/aa288104(VS.71).aspx
Code Pages Supported by Windows (コード表)
http://msdn.microsoft.com/en-us/goglobal/bb964654.aspx


5 :1:2010/07/12(月) 17:29:09
■これまでに行われた議論
・WinでCP50220 は Unicode からマルチバイト文字への変換でいわゆる半角カタカナを全角カタカナに置き換え
 内部的には Unicode -> CP932 -> CP5022x って変換な気もする
・人名をソートかけたらバストサイズ順の並びになる?
・Shift JIS や EUC-JP や Big5 や GB なんかをUnicode に変換してしまうと、ラウンドトリップは保証されるか
・単一情報をソースの文字コード(or 言語)情報なしに元に戻したい (統計的に文字の出現確率なんかを調べる)
・PC-98x1シリーズのMS-DOSはShift_JISだが漢字ROMはJIS、変換は何処で行っていた?
・0x5cをUnicodeにするときにバックスラッシュに置き換えるか円マークに置き換えるかで、逆変換時に結果が変わるの問題
・丸付き数字は機種依存文字か?。MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 Macではフォントによっては表示されないし、フォントによっては表示される
・Shift_JISと名乗っているCP932やISO-2022-JPと名乗っているCP50220を表示(Unicodeに変換)する際に
 機種依存文字はサポートされるか?
・Safari文字コード変換のバグは
・Microsoft文字コード変換のバグは
・U+31F0..U+31FF(アイヌ語表記用小書きカタカナ)が入ってない件
・なぜ携帯業界はunicode化しないのか?
・このスレへの書き込みはブラウザが2chへ送り出す時点でUnicodeからShift_JISに変換しているのか
・文字化けに強いishフォーマットでエロ画像を交換する場合、ssより、s7のほうが化けにくい

6 :1:2010/07/12(月) 17:30:27
・中国語の簡体字では、へんやつくりが簡略化されるなら、その文字も自動的に簡略化して表記する国家規格が有る
・中国語の「噁心」簡化政策によると「恶(U+6076)」に統一。口偏+恶(U+6076)は普通に使われているがUnicodeにはない
・日本人のニーズが満たせないのも確かなので原規格分離(中国では「曾→曽」は簡体字と繁体字の違いとはみなされていないとか)
・UNICODEを扱うプログラムはサロゲートをぶったぎられた入力が渡されてくる場合にも備えろって→YES
・UnicodeとUTF-8の違いは?
・日本のCJK Ext.D Submissionに{魚針}が含まれてる件
 U+9C75(魚箴)は強烈。いくら何でも違いすぎる。(魚針)
 ひょっとしたら後で実は別字だったとか日本では異体字だが中国では別字とかになるかも知れんぞ。
 中国ではってレベルじゃねーぞ。
・Windows Vista での「IME パッド - 文字一覧」の「JIS X 0213 (1面)」のバグ
 UTF-16: 0x304B 0x309A → Unicode: U+FD61809A (間違い) (ISO/IEC10646はU+10FFFFまで)
 サロゲートペアからコードポイントを引き出す計算を無理やり適用(間違い)
 ((0x304B - 0xD800) << 10) + (0x309A - 0xDC00) + 0x10000が 0xFD61809A になる。
・文字コードではインドカレーは飲み物か否か。カレーパンうまうま。
・CJK混在の漢字環境ってどうやって、切り分ければいいの? → ムリです。
・Winzipで保存されるファイル名が文字化け→zipではコードページ情報が無い。直接zipファイルから切り出せ
・Unicodeは言語情報を直接扱わない。 多言語の混在表現は(unicodeでは)できないか
・Unicode文字列リストを各国言語を考慮してソートしたいんですが → ムリです。
・Unicodeサニタイズが面倒になるのか

7 :デフォルトの名無しさん:2010/07/12(月) 17:50:37


8 :デフォルトの名無しさん:2010/07/12(月) 17:51:18


9 :デフォルトの名無しさん:2010/07/12(月) 17:52:16


10 :デフォルトの名無しさん:2010/07/12(月) 17:52:57


11 :デフォルトの名無しさん:2010/07/12(月) 17:53:38


12 :1:2010/07/12(月) 17:54:35
・SJISとUNICODEの判別はどのようにすればいいですか?BOM。無ければ、統計判断。 ライブラリを使うが吉
・ところでケータイのUnicode対応度って実際どうよ? → ウンコマークもUnicodeに追加されるんだな。
・WindowsXP で フォルダに使用できないフォルダ名はどうやって判定
  → ちょっとアホな方法だけど、%TEMP% フォルダの下で実際に作ってみて。本当に作成できるかどうかで判断。
・TwitterのWebインターフェイスからだと、サロゲートペアは2文字としてカウント。140字打てない 。
・Unicode 5.2で追加されたUnicodeSMP(第1面)、Unicode 5.1で未定義だったSMPのコードポイントや第15、第16面が
 Windows7では表示されない。 → 和田研細丸ゴシック2004ARIBはARIB外字を含んでいる。
・WindowsXP SP3でMicrosoftのJIS2004フォント環境でサロゲートペア文字が表示されない。→
 コントロールパネル-地域と言語のオプション-[言語]タブで
 「複合文字や右から左方向に書く言語 (タイ語を含む) のファイルをインストールする」にチェック
・URLの%で続く2桁の0-9、A-Fへの変換は、UTF-8→urlencodeによる。RFC1738を嫁。
・菊紋、桐紋、葵紋などは文字か?海栗コードへの挿入は難しい。そこでTRONだ!!
・元号を安置する場所はJIS第三で確保済み。ウニコードでブロックを確保は政治力次第。
・元号は個人名ではない。特定の時間軸基準に数える年号を漢字で指す文字。
 陛下の崩御後必ずしも元号が追号になるわけではない。むしろ違う場合が多い。昭和54年法律43号の元号法参照。
・文末でなければ"0"+ASCII7ビット、文末なら"1"+ASCII7ビットというエンコード。 → ヌル1バイトが貴重な時代からの負の遺産。
・Windows7出荷時に未定義だったコードポイントはフォント入れても豆腐になる。Unicode5.2は表示しない。欝だ。
・Unicode6ドラフトでPILE_OF_POO文字確定。ウニコードがもはやイミフ。SerifとSans-Serifで幅に違いは出る?
・shift-jisからUTF-8変換でサイズ1.5倍。でも圧縮すれば平均10%増加程度。用途に合わせて使うべし。
・「wchar_tは>849の嫁。>849の許可無くしてUTF16だの32だの無理矢理突っ込むのは許さん。」
・電子演算機では文字化けなんて飾りです。UTF-8/UTF16の人にはそれがわからんのですよ。

13 :1:2010/07/12(月) 17:55:32
■ライブラリ
IBM Globalization - ICU
http://www-306.ibm.com/software/globalization/icu/
NKF32.DLL
http://www.vector.co.jp/soft/win95/util/se020949.html
http://www1.ttcn.ne.jp/~kaneto/dll/nkf32dll.html
バベル
http://tricklib.com/cxx/ex/babel/
バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。
http://tricklib.com/cxx/ex/babel/scoremap.csv
mlang
http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx
iconv
http://www.gnu.org/software/libiconv/
ICU
http://www.icu-project.org/


14 :1:2010/07/12(月) 17:57:34
■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある
 表現できる文字空間はUTF-8と同じく20ビットとちょっと
・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。
 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。
今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。
似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、
素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。
・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって
 charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある
・MSでのウニコードとSJIS変換のバグ。
 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE
 U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】
・SafariでのウニコードとSJIS変換のバグ。
 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】
 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH
 U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA
・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。
 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。
 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで
 再変換しているので、それをしなければよい。
・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。
・JISのエスケープシーケンスが正しく認識されない本文とか。
 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。
 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。

15 :1:2010/07/12(月) 17:59:20
テンプレ終了。
今回はhttp://namidame.2ch.net/test/read.cgi/mitemite/1239039323/ 【支援要請】さるさんと闘うスレ【代理投下】
の方に協力いただきました。ありがとうございました。
それではマッターリ開始


16 :デフォルトの名無しさん:2010/07/12(月) 18:26:31
このスレ流れ速いね……

17 :デフォルトの名無しさん:2010/07/12(月) 18:35:11
     |
  (´・ω・) シャキーン
   ノメ、
  /一 /
/乙/ 彡
\/

18 :デフォルトの名無しさん:2010/07/12(月) 20:43:12
> U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】

これのどこがバグ?
逆波ダッシュに対応する文字なんて無いからこれでいいだろ

19 :デフォルトの名無しさん:2010/07/12(月) 22:29:01
UTF-8がascii互換とのことですが、最上位ビットが立っていないものはasciiだということでしょうか?

20 :デフォルトの名無しさん:2010/07/12(月) 22:53:41
そう言った奴にきけばー?

21 :デフォルトの名無しさん:2010/07/13(火) 11:49:00
シフトジスやEUC-JPだってASCII互換だべ。

22 :デフォルトの名無しさん:2010/07/13(火) 12:47:26
wchar_tにUTF16や32を突っ込みたいのですが、>849まで進まないと許可を得られないのでしょうか?

23 :デフォルトの名無しさん:2010/07/13(火) 16:17:14
文字の繰り返しとして使われる踊り字の規格とか、使用制限に関する文献なにかないだろうか。
日本語検索での踊り字 '々'(U+3005)に対応した例外処理が必要なんだが、
できれば既存の検索ライブラリで何か対応しているのは無い?
(例:淡淡と淡々、どちらもあっさりした味わい)
(○○会会長、△△家結婚式式場、これ等は踊り字を使うのは間違い)
やはり単語一覧での禁則処理を通した後、踊り字と文字繰り返しの二パターンで再検索かける必要が?


24 :デフォルトの名無しさん:2010/07/13(火) 18:30:16
>>19
確かにUTF-8はそうだけど、「ASCII互換」にそこまでの意味はないだろ。
ASCII文書だけ見るとUTF-8かASCIIか区別つかないってだけ

25 :デフォルトの名無しさん:2010/07/13(火) 18:39:18
どこかの言語処理系にローカルな言葉じゃないのか?
少なくとも誰にでも通用するような言葉じゃあない。

26 :デフォルトの名無しさん:2010/07/13(火) 21:02:08
Shift-JISは2バイト目に0x5Cなどが出てくるけどASCII互換?

27 :デフォルトの名無しさん:2010/07/13(火) 21:27:09
激しくスレ違いなのは承知での質問なのですが・・・

学校で行政が定めているキャラクタセットを挙げよという課題が出たので
インターネットや書籍を使い調べてみても全くわかりません

もしわかる人がいましたら教えてくださると嬉しいです
よろしくお願いします

28 :デフォルトの名無しさん:2010/07/13(火) 21:33:02
行政って何ですか?

29 :デフォルトの名無しさん:2010/07/13(火) 21:41:43
行政についての詳しい説明は特にありませんでした

行政が定めるということでJISコードなんかが当てはまるのかと思ったのですが
私は文字コードについての知識がゼロに近いので
これであっているかどうかが全くわからなく困っています

30 :デフォルトの名無しさん:2010/07/13(火) 21:46:05
JISの奴でいいんじゃね?

31 :デフォルトの名無しさん:2010/07/13(火) 21:50:05
うがった答えをするならGB18030とかKPS9566とか

32 :デフォルトの名無しさん:2010/07/13(火) 21:58:07
すいません
書き忘れてしまいましたが、日本の行政が定めているキャラクタセットとのことでした

やはりJISでいいみたいですね
返信してくださったかたありがとうございます
JIS以外には何か当てはまるものはあるのでしょうか
わかるいましたら教えてくださると嬉しいです

33 :デフォルトの名無しさん:2010/07/13(火) 22:03:56
頭痛が痛い、みたいな言い回しだよねえ。
JIS=日本の行政が定めたキャラクタセットって。

34 :デフォルトの名無しさん:2010/07/13(火) 22:09:24
重ねての質問なのですが「日本生命収容人名漢字」などのような漢字表も
キャラクタセットと呼ばれるものなのでしょうか?

課題を出せれた時の雰囲気からたくさんある感じだったので
これらを含めればかなりの数になると思うのですが

35 :デフォルトの名無しさん:2010/07/13(火) 22:55:15
まずはWikipediaで調べてみれ
ttp://ja.wikipedia.org/wiki/%E6%96%87%E5%AD%97%E9%9B%86%E5%90%88

36 :デフォルトの名無しさん:2010/07/13(火) 23:05:54
なんとなく、その課題自体が、エンコーディングスキームのいくつかを
回答の一部として想定しているという疑い。



37 :デフォルトの名無しさん:2010/07/14(水) 00:06:06
ユニコードと日本の行政によって定められているキャラクタセットとの
関係がどうたらこうたらというような課題で
その第一段階として上記のことを調べよということでした

漢字表をキャラクタセットと呼んでいいかは符号化?がされていれば
呼んでいいのでしょうかね
難しいです

こんな個人的なスレ違いの質問に大して優しく返信してくださって
ありがとうございます
まさか2ちゃんでこんな優しくされるなんて思ってもみなかったです

38 :デフォルトの名無しさん:2010/07/14(水) 00:33:26
失礼だな、プログラム板はどこも、まともな質問にはまともに答えるよ

39 :デフォルトの名無しさん:2010/07/14(水) 18:56:06
次回のテンプレに追加
フリーグリフデータベース『グリフウィキ(GlyphWiki)』
http://glyphwiki.org/wiki/GlyphWiki:%e3%83%a1%e3%82%a4%e3%83%b3%e3%83%9a%e3%83%bc%e3%82%b8


40 :デフォルトの名無しさん:2010/07/14(水) 21:55:56
>>32
勘違いするな。>>30が言っているのは「JIS」じゃない。
JIS X 0201(半角文字)とかJIS X 0208(全角文字)とかのことだ。
これで回答が「JIS」だったらその学校晒せ。

41 :デフォルトの名無しさん:2010/07/14(水) 21:58:40
JISは大臣が制定するから行政というのはよしとして、それ以外に日本で行政が絡んだ規格は
無いだろ。

42 :デフォルトの名無しさん:2010/07/14(水) 22:02:27
JSAは経産省所管の公益法人だから、行政と言えば行政だが...
常用漢字表とか戸籍統一文字とか住民基本台帳ネットワーク統一文字のことを
調べさせようとしてるのかな?

43 :デフォルトの名無しさん:2010/07/14(水) 22:07:07
学校で文字コードまわりの課題出してくるなんて、悪い学校じゃないな。
mixiのどこかのコミュあたりでvoid探して半角カナでコメント付ければ
きっと殺伐と基礎を叩き込んでくれるよ。

44 :デフォルトの名無しさん:2010/07/14(水) 22:17:40
Firefox 4のNightlyに素晴らしい機能が入った。
about:configでgfx.font_rendering.harfbuzz.level=1に設定すると、こんなことが可能になる。
<!DOCTYPE html>
<html lang="ja">
<style>
@font-face {
font-family: BodyText;
src: local("Meiryo");
}
@font-face {
font-family: ArialUni;
src: local("Arial Unicode MS");
}
body { font-family: BodyText; }
.hwid { -moz-font-feature-settings: "hwid=1"; }
.jp90 { -moz-font-feature-settings: "jp90=1"; }
:lang(ja) { -moz-font-language-override: 'JAN'; }
:lang(zh-CN) { -moz-font-language-override: 'ZHS'; }
</style>
<p class="hwid">半角ひらがなが使えるよ</p>
<p>葛飾区</p>
<p class="jp90">葛城市</p>
<p lang="ja" style="font-family: ArialUni;">骨</p>
<p lang="zh-CN" style="font-family: ArialUni;">骨</p>
</html>
これはCSS Fonts Module Level 3の先行実装(-mozが付いてるのはまだドラフトだから)。
http://dev.w3.org/csswg/css3-fonts/

45 :デフォルトの名無しさん:2010/07/14(水) 22:21:17
>>26
ASCII互換でしょう。
 EUC-JP: ASCII環境では読めない。2バイト文字はASCII文字と区別しやすい
 Shift-JIS: ASCII環境では読めない。2バイト文字はASCII文字と区別不能
どっちも読めないことに変わりはない。読めない状態でどっちがマシかを語られても困る。

46 :デフォルトの名無しさん:2010/07/14(水) 22:24:25
>>44
ここはフォントスレじゃないよ。たぶん

47 :デフォルトの名無しさん:2010/07/14(水) 22:28:01
半角の話なら隔離スレの方がいいんじゃない?voidさんネタもあるし。

48 :デフォルトの名無しさん:2010/07/14(水) 22:28:54
>>45
区別不能ってのは微妙な表現だぜ。

49 :デフォルトの名無しさん:2010/07/14(水) 22:40:35
>44
字形なんて一つの段落で混在させたいに決まってるのになんでpなの。spanでも使える?

>48
Shift-JISを知らない、ASCIIしか知らないプログラムからしたら、81 5Cが
 <未知の文字> + <ASCIIの5C>
に見えちゃうんだよね。
「2バイト文字は無理にデータを通そうとすると2バイト目が誤判断必至」とか

50 :デフォルトの名無しさん:2010/07/14(水) 23:03:53
>>42
> JSAは経産省所管の公益法人だから、行政と言えば行政だが...
> 常用漢字表とか戸籍統一文字とか住民基本台帳ネットワーク統一文字のことを
> 調べさせようとしてるのかな?

俺も最初に「戸籍統一文字」を思い浮かべた。言われてみれば確かに常用漢字表もキャラクタセットだよね。

51 :37:2010/07/15(木) 01:19:32
ありがとうございます
そのへんを課題の解答として提出してみます
返信してくださったかた本当にありがとうございました

52 :デフォルトの名無しさん:2010/07/15(木) 20:38:16
>>45
前スレのfopenの続きのここにSJISはASCII非互換って書いてあるけど。
http://pc12.2ch.net/test/read.cgi/tech/1093251312/281


53 :デフォルトの名無しさん:2010/07/16(金) 01:00:01
互換性っていっても、いろいろあるからなぁ。
言葉の定義(あるいは文脈)の問題だが、何の文脈もなく互換か非互換かと聞かれたら俺なら互換って答えるなぁ。

54 :デフォルトの名無しさん:2010/07/16(金) 21:33:46
汎用電子のレビュー期間がもう終わってるけど登録マダー? (AAry
http://www.unicode.org/ivd/

55 :デフォルトの名無しさん:2010/07/18(日) 03:03:49



(読み:ルピー)

56 :デフォルトの名無しさん:2010/07/18(日) 20:42:31
>>55 インド通貨の文字として採用されたやつだな。

57 :デフォルトの名無しさん:2010/07/18(日) 21:58:53
U+20A8はU+20A0と同様の死んだ記号になるのかね。
日本円と人民元はUnifyしてるくせに。

58 :デフォルトの名無しさん:2010/07/19(月) 13:42:02
JC…日中
JK…日韓

59 :デフォルトの名無しさん:2010/07/19(月) 14:08:39
J…JSは?(´Д`;)ハァハァ

60 :デフォルトの名無しさん:2010/07/19(月) 14:15:26
>>59
それ犯罪まじヤメロ

61 :デフォルトの名無しさん:2010/07/19(月) 14:36:43
確かシンガポールの漢字も入ってたよな

62 :デフォルトの名無しさん:2010/07/19(月) 15:24:52
>>57
ルピーはインド以外でも使われてるから、まだ必要なはず。


63 :デフォルトの名無しさん:2010/07/19(月) 17:07:01
インドルピー考察
http://typophile.com/node/72290
文字レンダリングの問題点なんかで面白い考察が行われているな。
フォントによっては可読性が失われる場合の処理とか。
U+20A8 http://www.unicode.org/charts/PDF/U20A0.pdf

64 :デフォルトの名無しさん:2010/07/25(日) 14:12:15
何でいまだにEUCとかShift_JISとか使ってるの?
みんな自分のキーボードで「りっぽうめーとる」変換してみ?
Unicodeにしかない記号文字が入力できるぞ。
たいていどんなソフトでもIME使って日本語OSから入力可能な文字は、
全部処理できないといけない。その用件を満たすためにはUTFを使う
しかない。

65 :デフォルトの名無しさん:2010/07/25(日) 14:23:44
たしかに2chがいまだにSJISなのは問題あるな

66 :デフォルトの名無しさん:2010/07/25(日) 14:40:00
>>64
立方メートルのために使える文字コード変えようとは思わないな。
トンパ文字が使えるからってTRONコードにしたいと思わないのと同じで。

67 :デフォルトの名無しさん:2010/07/25(日) 14:55:04
立方メートルはともかく、
人名地名の漢字を理由にUnicodeに移ってくれと思う。

68 :デフォルトの名無しさん:2010/07/25(日) 16:09:30
トンパ文字と立方メートルじゃ需要が違いすぎるだろ。
とはいえ立方メートルのためにARIB外字に移行するのは勘弁してください><

69 :デフォルトの名無しさん:2010/07/25(日) 22:47:26
立方メートルってどこに需要あるの?
一般的な書類ではもはや「立方メートル」って表記するのが普通だし、
理系の文章では立方メートルがあるくらいじゃどうせ表現不足。

70 :デフォルトの名無しさん:2010/07/25(日) 23:39:01
表現力を言い出したらプレーンテキストで用が足りることなんかありえないし
マークアップ言語ですら怪しい
PDF使ってろ

71 :デフォルトの名無しさん:2010/07/26(月) 01:30:03
>>70
> 表現力を言い出したらプレーンテキストで用が足りることなんかありえないし
そのとおり。だから、立方メートルをわざわざ文字として入れるメリットは薄いし、それのために文字コード決めるなんてことはありえない。

そりゃ、究極はPDF, SVG, PostScriptになるのだろうが、LaTeX程度に強力なマークアップ言語なら大体は事足りるよ。

72 :デフォルトの名無しさん:2010/07/26(月) 21:13:37
texファイルを直接読む人にはそれで十分だろうねw

73 :デフォルトの名無しさん:2010/07/27(火) 01:22:51
>>72
立方メートルくらいならTeX記法で十分読める

74 :デフォルトの名無しさん:2010/07/30(金) 16:47:17
せめてLaTeXでお願いします。

75 :デフォルトの名無しさん:2010/08/04(水) 00:18:01
RUPEE SIGN提案だらけ

76 :デフォルトの名無しさん:2010/08/04(水) 01:33:51
ファイルやデータベースに文字データを普通に保存するときの文字コードとしてはUnicode
を使わないと、日本語OSで使える文字の一部が正しく保存できないということですね。

77 :デフォルトの名無しさん:2010/08/04(水) 01:41:07
は?

78 :デフォルトの名無しさん:2010/08/04(水) 04:37:27
へ?

79 :デフォルトの名無しさん:2010/08/04(水) 07:23:37
>>76
そう思ったら波ダッシュを使ってみよう。

26 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)