hirax.net::Keywords::「Xerox」のブログ



1999-12-04[n年前へ]

WEBの世界の「力の法則」 

「ReadMe!JAPAN」と「日記猿人」に見るWEBアクセス数分布

 以前、

の中で書いたように、「Webの成長のダイナミクスとトポロジは,物理学の世界のPower(累乗)Lawとして知られている法則に従っている」という面白い話が世の中にはある。これは、「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」ということである。「インターネットのほとんどのアクセスというものは、ごく少数の特定のサイトへのものである。」ということだ。宇多田ヒカルの売り上げが演歌の総売上をはるかに超えるという話とよく似ている。実社会でもそういうことは実に多い。

 どうも、マイナー趣味である私には、Power(累乗) Lawというのはいま一つ面白くない話ではあるが、

といった所を眺めていくと、どうやら事実であるようだ。ここらへんのWEBはとても読んでいて面白い。そのせいか、似たようなことで遊んでみたくなった。そこで、今回はその"PowerLaw"、すなわち、「力の法則」について考えてみたい。ところで、本来ここでの意味は"Power"=「累乗の法則」となるが、ここでは「力の法則」としておく。

 まずは、考えるためのデータを採取してることにした。欲しいデータは色々なWEBサイトへのアクセス数である。もちろん、自分のWEBサイトへのアクセスではないのだから、何らかの公開データを探さなければならない。

 そこで、ReadMe!Japan(http://readmej.com/)と日記猿人(http://wafu.netgate.net/ne/)という二つのランキングシステムを用いてみた。ReadMe!Japanは日本語の「読み物」を主体としたWEBランキングである。また、日記猿人は名前の通り「日記」をターゲットとしたWEBランキングである。

 一見、同じように見えるReadMe!Japanと日記猿人のランキングであるが、かなり違ったシステムである。以下に、Readme!Japanと日記猿人のランキングシステムを示してみる。

  • Readme!Japan 登録したWEBページに、一日の間にアクセスしたIPアドレスの数。
  • 日記猿人 「投票」ボタンを押した人(ブラウザー)の数、一日の間に一人の人(ブラウザー)が同一の日記に対して複数回の投票は行うことが出来ない。
 したがって、Readme!Japanに対して、日記猿人は「投票ボタンを押す」という作業が余計に必要となる。単純に「読まれた数=得票」ではないのである。読者に「投票ボタンを押そう」という気持ちを生じさせることが必要とされるのである。
一方、Readme!JapanはIPアドレスベースであるから、同一のProxyなどを経由したアクセスの場合、何人からアクセスがあろうと1pointである。しかし、読者に「投票ボタンを押す」というような作業は要求されない。

それでは、日記猿人とReadMe!JAPANの得票ランキングの例を示してみる。横軸はランク(順位)であり、縦軸が得票数である。ここでは縦軸・横軸共に線形軸を用いている。

日記猿人とReadMe!JAPANの得票ランキングの例 (線形軸)

 なお、 Readme!Japanは11/30日のものであり、日記猿人は(ほぼ)11月分の得票数分である。
このグラフを眺めてみると、日記猿人とReadMe!JAPAN共によく似ている。なるほど、少しランクが下がっただけで、急激に得票数が少なくなっている。もう、縦軸で言うならば下に張りついてしまっている。「ごく少数のWEBサイトへのアクセス、あるいはリンクが他を圧倒する程の割合を示す。」という「WEBの世界の力(累乗)の法則」は日記猿人とReadMe!JAPANでも当てはまるようである。

 さて、ここまでランクに対して得票数が変化するとなると、グラフの軸は線形軸でなくて対数軸の方が良いだろう。そこで、グラフの軸を対数軸に変えたものを以下に示す。

日記猿人とReadMe!JAPANの得票ランキングの例 (対数軸)

 こうすると、日記猿人とReadMe!JAPANのどちらも、

  • 上位のランク(例えば、1位から1000位程度まで)では傾きがほぼ1である。すなわち、ランクが一桁下がると、アクセス数も一桁下がる。
というようなことがわかる。まさに、「力(累乗)の法則」である。確かに"Power"である。

 また、ReadMe!JAPANでは、ランクが極めて大きい所では得票数が0に近い。おそらく、その影響と考えられるが、ランクと得票数の関係が直線でなくなっている。

 それと同じことは日記猿人でも言えるだろう、ただし、「ランクとポイントの関係が直線でなくなる」のがReadMe!JAPANよりも早いような気がする。しかし、それは誤差かもしれない。参加数もかなり異なっているので、誤差の可能性が高いと思われる。

 さて、これまでは日記猿人とReadMe!JAPANのランキングの数字を直接用いてきたわけである。しかし、得票数の全く違うものをそのまま比較してもしょうがない。ある程度条件をそろえた上で比較をすべきであろう。そこで、縦軸を正規化して比較をしてみることにした。得票数の合計が1であるような単位に変換してみるのである。

 ここで、横軸はランクのLog_10を用いている。本来、ランク(順位)も何らかの正規化の変換をすべきであろうが、今回はやり忘れた。きっと、頭が疲れているせいである。

 また、グラフを見ればわかると思うが、それぞれについて近似曲線を計算している。

日記猿人とReadMe!JAPANの得票ランキングの例
(得票数の合計が1であるような単位に変換したもの)

 次に、ここで得られた「ランクとポイントの関係」を示す近似関数

  • ReadMe!JAPAN  y = -0.001x^5 + 0.0119x^4 - 0.0534x^3 + 0.1186x^2 - 0.1355x+ 0.0683
  • 日記猿人 y = -0.0005x^5 + 0.0054x^4 - 0.0222x^3 + 0.0472x^2 - 0.0589x+ 0.0391
を重ねて示してみる。
ReadMe!JAPANと日記猿人の「ランクとポイントの関係」近似関数の比較

R eadMe!JAPANでも日記猿人でも横軸が2以上(すなわち100位以下)の場所などでは、ほとんどポイントはゼロみたいなものである。すなわち、100位より下のWEBのアクセス(本WEBへのアクセスも含めて)は誤差みたいなものなのだ。何しろ、一位(トップ)のポイントが0.07とか0.04とかなのだ。それは「一位のWEBサイトへのアクセスが全部のサイトへのアクセスの1割弱を占める」ということなのである。20位までのサイトへのアクセスを合計すると全アクセスの50%以上を占めてしまう。これが、恐るべきWEBの世界の"PowerLaw"、すなわち、「力(累乗)の法則」である。

 ところで、日記猿人では上位サイト(すなわち、横軸で0に近いところ)での関係式の傾きがReadMe!JAPANよりも小さい。すなわち、上位サイトの得票数が拮抗している。これは一体何故だろうか?
私はこの理由を、

  • 日記猿人の読者が割と似ている趣味を持っている
  • 日記猿人の参加WEBサイトが似たような内容を持っている
ということではないか、と考えている。

 日記猿人の参加WEBサイトが似ており、読者同士が割と似ている趣味を持っていれば(私も含めて)、得票数というのは当然横並びになるだろう。上位サイトにはほとんどの人が見に行き、そしてほとんどの人が「投票」ボタンを押せば、上位サイトはみな同じような得票数を示すことになる、と思うのである。
 それは、違う傾向を示すReadMe!JAPANの中でも、読者層も作者も似ている「Fast&First」と「今日の必ずトクする一言」はとても近い得票数を示している、ということがその根拠の一つである。

 それに対して、ReadMe!JAPANが比較的広いジャンルの「読み物」が集まっているのでそういう現象が見られないのだろう、と考えるのである。しかも、実際には「読み物」ですらないものも集まっているので、なおさらジャンルとしてはバラけている。だから、「WEBの世界の力(累乗)の法則」を素直に反映していると考えるのである。

 私としては、ごく一部のWEBサイトへの集中が生じるのはツマラナイと感じてしまうのであり、「WEBの世界の力(累乗)の法則」はキライである。だからといって、趣味が似た人ばかりというのもツマラナイように思う。うーん、どういうのがツマラナクナイのだろうか?
それはきっと、「色々な趣味の人が色々なWEBへアクセスする」というのが私の好みだ。実現は難しいのだろうけど...いや、そんなことはないか。

2000-01-13[n年前へ]

WEBサイトの絆 

WEBの世界を可視化しよう




 目に見えないものを実感できるものにしようと思うことは多い。「直接感じることが出来ないものを感じられる形にする」という作業とその結果には非常にわくわくさせられる。それは、きっと私だけではないと思う。

 目に見えないものは色々ある。可視化して見てみたいものは多々あるのだが、以前、

の時に扱った、WEBのトポロジーなどもその最たるものである。WEBページはもちろん目に見えるわけではあるが、それらがどう繋がっているか、すなわち、WEB[= クモの巣(状の物);織物 ]そのものは目には見えない。

 ネットワークという目に見えない世界でWEBサイト同士がどう繋がっているか、それは企業のWEBサイト同士であれば企業間の繋がりを示すかもしれないし、公的機関のWEBであれば公的機関内部の繋がりが見えてくるかもしれない。そして、個人WEBであれば、個人どうしの繋がりが見えてくるだろう。そして、さらに考えを進めるならば、それが「WEBの繋がりだ」と端的に言い切ってしまっても良いと思う。

 そういう色々なWEBサイト同士が互いに結びつき合う、つまりWEBそのものを今回は可視化してみたい。その結果はきっと「WEBサイトの絆」を私に見せてくれるはずだ。

 例えば、ファイルシステムを可視化するものであれば、

  • xcruise( http://tanaka-www.cs.titech.ac.jp/~euske/index-j.html )
といったファイルシステムを宇宙空間に見たてて、表示するようなものがある。また、そこまで派手でなくても通常のファイラーやエクスプローラのツリー表示などもファイルシステムの構造を可視化しているといっても良いだろう。(そういえば、かつて富士XeroxがWindowsのファイルシステム中のドキュメントを色々面白い3次元表示で表示、検索してくれるソフトを扱っていた。なかなか面白いソフトだったと思うのだが、今ではどうなっているのか?)

 そして、今回の本題のWEBサイトのHyperlink構造を可視化するソフトウェアも、少し探しただけでも結構ある。例えば、

といったところだ。確かappleもこういったツールの開発を行っていたように思うが、どこに情報があるのか忘れてしまった。
 しかし、よく調べていないので間違っているかもしれないが、この辺りのソフト(appleを除く)はWEBサイト内のリンクのみに限られるようである。それでは、今回の目的とは違う。何しろ、今回知りたいのはWEBサイト同士のリンクの度合いである。WEBのトポロジーなのである。

 そこで、もう少し探してみる。すると、今回の目的にかなり近い情報が

に見つかった。perlでWeb Robotを作成し、"*.go.jp"のサイトに放ち、ハイパーリンクのデータベースを作成し、それを解析・可視化したものである。その結果のハイパーリンクの具合を可視化した図が、リンク切れで見ることができないのが実に残念だが、非常に役に立つ情報が満載である。ほとんど、私のしてみたいことそのものである。しかし悔しいことに、その結果の図を見ることが出来ない。そこで、同じようなことを自分でやってみることにした。

 やり方はどうしたら良いだろうか?宮久地氏と同じようにWeb Robotを作成して、データを集めるのが理想的だろう。しかし、「perl入門」を昨日やっと買ったばかりの私にはとても難しそうである。いや、もしそんなことをしたらとんでもないことになるに違いない。

 そこで、perlのlwp-rgetを用いて各WEBの内容をローカルのPC内にダウンロードした上で、勉強がてらperlで解析を行うことにした。と、思ったのだが、lwp-rgetが上手く動いてくれない。まだドキュメントをちゃんと読んでいないせいだろうか?何故か、ダウンロードの途中で終了してしまう。仕方がないので、急遽作戦を変更し、ダウンロード作業はlwp-rgetではなくてwgetを用いることにした。

 行った手順は以下のようになる。

  1. 5つのWEBサイトを広いWEB内から適当に選択する
  2. 選んだ各WEBサイト内のファイルについて、相互のハイパーリンクを抽出し、その数を解析する
  3. その結果を可視化する
 今回選択したWEBサイトはA,B,C,D,Eという5つのサイトである。A〜Dについては、サイト内の全てのページについて解析を行った。Eに関しては、サイト内の特定の1ページについてのみ解析を行った。A〜Dのサイトに関しては、名前は伏せておく。サイトEに関してのみ名前を明らかにしよう。Eは日記猿人というサイトの中の「今月の得票数」を示すページである。そう、今回選択したWEBは全て「日記猿人」という一風変わったコミュニティー内のサイト群から抽出したのである。

以下に、解析を行った結果、すなわちサイトA,B,C,D,Eの相互に対するリンク数を示す。

A,B,C,D,Eの相互に対するリンク数
↓から→へのリンク数
A
B
C
D
E
A
-
0
2
0
27
B
1
-
0
13
273
C
20
2
-
0
43
D
0
11
0
-
285
E
1
1
1
1
-
合計
22
14
3
14
/

 サイトE「日記猿人」へのリンクがムチャクチャ多いのは投票ボタンという形で、他のサイトからリンクがなされているからである。

 さて、上の表からではWEBの絆を実感できないので、「WEBの絆」を3次元空間に可視化するJavaアプレットを以下に張り付けておく。WEBサイトが5つあるので、それぞれのサイトをピラミッド構造(四角柱状)に配置した。
 各WEBサイトの表示色は、

  • A = 赤
  • B = 緑
  • C = 青
  • D = 黄
  • E = 灰
という五色を用いた。そういつぞやと同じ五色である。imacも五色(6?)だが、今回のターゲットサイトも五色なのである。

 それぞれのサイトから伸びる直線の長さは、そのサイトから他のサイトへ向かうリンク数に比例したものにしている。また、直線の太さもリンク数に比例させている。また、それぞれのWEBサイトを示す立方体の大きさは自分へ向かうリンク数に比例させている。ただし、サイトEの大きさはあまりにも巨大なため、リンク数に比例したものにはなっていない。また、サイトE、すなわち「日記猿人」、へのリンクは省略し、全てサイトEからの直線リンクを表示するだけにした。

 さぁ、WEBサイトの構造を自分の目でみて、そしてグリグリ動かして見てもらいたい。このグラフの操作方法は

  • 操作 = 作用
  • マウス左ボタンドラッグ = 回転
  • シフトキー + 垂直ドラッグ = ズームイン・アウト
  • シフトキー + 水平ドラッグ = 垂直軸についての回転
  • コントロールキー + 垂直ドラッグ = 焦点距離の変更
  • マウス右ボタン垂直ドラッグ = 部品除去
  • "s"キー = ステレオ画像作成
である。表示をステレオ画像にして、WEBの世界へダイビングしてみよう。

 Java表示が上手く動かない人のために、静止画も一応張り込んでおく。

WEB構造を可視化したもの

 どうだろう?この5つのWEB間のWEB構造から何が見えるだろうか?こういう解析を数多くのサイトに行うと非常に面白い結果が得られそうである。特に「日記猿人」のようなコミュニティーに対して行うと興味深い結果が得られるはずだ。
 私のような「日記猿人」の日記はほとんど読まない(サイトAに関しては大ファンであるが)人間にとっても興味深いのであるから、関係者にとってはきっと...の筈だ。

 さて、今回はテストのためにごく少数(5つ)のWEBの解析を行ってみた。いつか、こういった解析を広い範囲で行い、そして、時系列的な変化をも調べようと思う。銀河のvoid構造が観測され、可視化されたものを見たときもとてもわくわくしたものだが、WEBの構造・変化ならばどうだろうか?

 不思議なことに、そういうことを考えていると、「新宿都庁」と「思い出横町」が頭の中に浮かんできてしまうのは何故だろうか?押井守の影響だろうか。謎である。

 そして、こうも思う。WEBネットワークの中でWEBサイトは何を感じているのだろうか?これらのWEBサイトはもしかしたら孤独を感じているのだろうか、それとも繋がりを感じているのだろうか?あの時のページの中の一フレーズがその答えの一つなのかもしれない。

2000-04-07[n年前へ]

Canon Simplex + 

オリジナルとコピーの追復曲

 野田秀樹、NODA MAPの新作「カノン」が上演されている。観に行きたいのだが、距離のせいかなかなか見に行けそうにない。
 観ていないので内容は知らないのだが、タイトルのカノンは「規範」を意味するギリシャ語のkanonだろう。英語で言えばcanonである。辞書でカノン(canon)を調べてみると、

  1. 規範、原則、標準、規準、根本原理 類似語 = "criterion"
  2. 基本的重要文献
  3. 真作品
  4. 教会法
  5. 聖書正典、正経
  6. 音楽形式のカノン、追復曲
  7. 48ポイントの活字
というような言葉が出てくる。「これはC言語のバイブルだ」などの言い方はよくすることがあるが、それに誓いニュアンスだろうか?
 ちなみに、音楽形式としてのカノン=追複曲は、「主題としての一声部が応答としての他声部に模倣される形式」とある。「かえるの歌が聞こえてくるよ…」はその単純な例である。一つのメロディから導き出された旋律が重なり合っていくわけだ。あるいは、山下達郎の「クリスマスイヴ」の中間部のパッヘルベルのカノンといった方がわかりやすいだろうか。
 音楽形式の「カノン」では、最初の旋律が主題であり原典である。そして、その模倣旋律が組合わさって、魅力的な音楽が作られていく。

 ところで、「カノン」という言葉の意味の大きな割合を占める「聖書」という言葉を考えた時、音楽形式である「カノン」と似たようなものがある。
 それは印刷技術である。と、書くと、唐突に感じるかもしれない。しかし、聖書の複製をきっかけとして広まった技術が、印刷技術である。それほど、関係がないわけではない。印刷技術は、グーテンベルク(ちなみに、今年はグーテンベルク= Gutenberg, Johann Gensfleischの生誕600年目である)の「42行聖書」から始った原典を複製する技術である。
 印刷技術は、一つの原典から複数の複製物が作り出されていく。それは、一つの旋律から導き出された複数の旋律が追いかけていく、音楽のカノンそのものである。印刷技術はもうひとつの「カノン」なのである。
 

グーテンベルクの「42行聖書」

 本来、「カノン」という言葉は「規準、原典、教典」を指すわけであるが、同時に、この「カノン」という言葉には「複製」という匂いがつきまとう。先の追復曲=カノン、そして印刷された聖書もそうだ。

 グーテンベルクの「42行聖書」は200部程度印刷された。それらはいずれも色々な装飾がされ、同じ物は一つとしてない。どれも個性豊かなものである。音楽の「追復曲=カノン」でも、輪唱のようなごく単純なカノンを除けば、旋律は魅力的に変化されていく。旋律はどれも個性豊かなものである。個性がなければ、それはとてもつまらない輪唱に終わってしまう。

 きっと、NODA MAPの「カノン」では野田秀樹の「言葉を繰り返し、次々と意味を転じさせて、そして、何者かを描写していく力」が発揮されるのだろう。考えてみれば、野田秀樹の「言葉を操るやり方」もカノンそのものである。模倣から始まったモノであっても、何かが新たに加えられていくならば、それは模倣でなくなって、きっといつかは原典になるのだと思う。逆に、あまりに原点としての「カノン」を守ろうとしたものは、それは単なる「コピー」に終わる。

 さて、ところで「コピー」という言葉と「canon」という言葉を考えるとき、ある企業(が頭の中に浮かぶ。「Xerox」というオリジナル旋律に派生する企業である。

 原典とされた「Xerox(富士ゼロックス)」はかつて、丸善石油のCM「オー・モーレツ!」を原典として、「モーレツからビューティフルへ」というCMを作り上げた。それは素晴らしい本歌取りである。60年代を代表する「オー・モーレツ!」という「キャッチ・コピー」を、「コピー」して、さらに変化させることで70年代へ繋がる「モーレツからビューティフルへ」という「キャッチ・コピー」を作り上げたのである。それはもう、一つの哲学であるといって良いと思う。

 一方の企業は80年代に苺の「コピー」にミルクをかけてみせ、「本物と"コピー"の違いは見分けられない」というCMを作り上げた。原典と「コピー」に違いがあるのか?という問いかけである。それもまた一つの哲学だろう。

 原典にこだわりすぎ、単なる「コピー」に終わるか、それとも、何者かを加え「本歌取り」としての「カノン」にすることができるか、それは「Vision」の有無にかかっている、のかもしれない。本当の「カノン」になるかは、「Vision」次第だ。そんなに深い意図はないし、適当に書いてみただけだけれど。

 うーん、今回はやっぱり、「スクラップ」行きだな。(BGM & Title ゴルトベルグ変奏曲による14のカノンJ.S.Bach)
 

2000-04-09[n年前へ]

心に浮かぶハートマーク 

色覚の時空間特性で遊んでみよう

 4月である。「四月物語」の4月である。

で書いたように、私は4月だけは英語の勉強をしたくなるのである(何故なら、全然できないから)。そこで、ここのところ英語の先生のところに足繁く出向いている。その時に、信号機の例題を出されて「青信号」と言おうとして私は"ablue light"と言ってしまった。すると、「青信号は"green"だ -> The run signalis green.」と言われてしまった。しまった、確かにその通りだ。いや、英語でそう表現することに納得という話ではない。英語ではこうだと言われたら、私はそのまま頷くのみである。"Yes,sir"状態である。納得したのは、信号機の「現実の」色の話だ。そう言えば、日本でも信号機は「緑色」だった。試しに、信号機の一例を次に示してみる。
 
MacOS Xのファインダー上の「緑」信号

実は人にそう優しくないユーザーインターフェースの一例

 本当は「緑色」なのに、「何故、青信号と言われていたのだっけ?」と考えながら、帰り道に交差点、「緑」信号をじっと見ていた。すると、「緑」信号は消えて、黄信号になった。しかし、私の目にはその瞬間「赤」信号が見えたのである。
 私は夢を見ていたわけでも、予知能力があるわけでもむろんなくて、それは単なる錯覚である。「緑」信号が消えた瞬間に「赤」信号が見える、という錯覚である。

 私が見た「赤」信号機の錯覚を実感してもらうために、こんなアニメーションGIFを作ってみた。ソフトをレジストしてないが故の、SGという文字は気にしないでもらいたい。下の画像中央にある黒い点を見つめていて欲しい。すると、緑のハートマークが消えた瞬間から、赤いハートマークがおぼろげに見えるはずである。
 

白地に浮かぶ赤いハートマーク
(黒点を見つめること。)

 

 これは、色覚の時間特性による錯覚の一つである。実際に、赤いハートマークがあるわけではない。私の心の中にだけ、浮かぶハートマークである。

 その原因となる色覚の時間特性を示すグラフを以下に挙げる。これは色覚の時間特性を示すグラフの例である。色覚のインパルス応答のようなものである。ある色を見た後には、その色の反対色を感じるということを示している。
 

色覚の時間特性を示すグラフの例
朝倉書店 内川恵二著 色覚のメカニズム 色を見るしくみ より
 このような、色覚の時間特性により、緑色のハートマークを見た後に、赤いハートマークが心の中に見えたのである。ハートマークの黄色い縁取りの残像は青く見えるのだ。そして、同じように私の信号機の錯覚に繋がるのだ。

 このような錯覚というのはとて興味深いものである。視覚という「デバイスの特性」が「目に見えて実感できる」ことが特に面白い。以前、

で考えた「電子写真」の画像特性や、の時のCCDや液晶といったものの画像特性を考えたときにも何故だかその「デバイスの変なところ」というものには心惹かれるのである。何故なら、私は「短所は長所」でもあると思うからだ。いやもちろん、「長所は短所」というわけで、要は考え方と使い方次第、ということだ。

 さて、先の錯覚は色覚の時間特性によるものだった。それと全く同じような錯覚が、色覚の空間特性から得ることができる。そのような錯覚の一つにこのようなものである。それを下に示してみる。
 

白い線の交差部が赤く見える錯覚

 この有名な画像パターンを見れば、「白い線の交差部が赤く見える」はずだ。

 これは、色覚の空間特性によるものである。これを示すグラフの例を以下に示す。この場合もやはり色覚の時間特性のように、ある刺激があるとその周囲に反対の色の影響が表れる。例えば、周りに白が多いと、その部分は黒っぽく見える。赤色の周りは緑がかって見えるのである。逆に緑色のものの周りは赤く見えるのだ。
 そして、それをさらに進めると、周囲に赤色が少ない場所は、周りに比べて赤く見えるのである。上の画像で言えば、白の交差部は、赤の刺激が少ないので、赤の刺激を逆に感じるのである(ちょっと説明をはしょりすぎかな)。
 

色覚の空間特性を示すグラフの例
朝倉書店 内川恵二著 色覚のメカニズム 色を見るしくみ より

 今回は、このような色覚の空間特性をシミュレートしてみたい。道具は単純にPhotoshopだ。もう手作業でやってみるのだ。ネコの色覚で遊んだ

の時と同じである。
 
色覚の空間特性をシミュレートし、錯覚を生じさせてみる
 これがオリジナル画像。黒背景に白い線で格子模様が描かれている。
  白い(つまり光刺激が多い領域)からの影響を考える。先に示したグラフのように、光刺激がある箇所と少し離れたところではそれと逆の刺激を受けたような効果がある。
 そこで、まずは白い部分からの影響をガウス形状のボカシにより、真似してみる。ある画素から少し離れた所に影響が及ぶのをシミュレートするのである。
 白い部分からの影響(実際には、比較問題となるので黒い部分からの影響と言っても良いだろうか?)は「白と逆の方向、すなわち黒い方向」に働く。
 そこで、上の画像を階調反転させる。すなわち、ある画素から少し離れた所に元の明るさと逆の影響が及ぶことをシミュレートするのである。そしてさらに、階調のカーブを鋭くしてやる。
 
 上で計算したものとオリジナルの画像を加算してやる。これが、人間が感じる画像をシミュレートしたものである。
 白い格子の交差点部が黒く見えているのがわかると思う。といっても、もともとその部分は黒く見えていたとは思うが。

 下に、シミュレート画像とオリジナル画像を並べてみる。

シミュレートした画像
オリジナル画像

 このようにして、オリジナル画像を見たときに感じる錯覚をシミュレートできたことになる(もどきだけど)。

 さて、上では簡単のためにグレイスケールで遊んでみたが、最初に示した赤白の場合のようなカラーの例を示してみる。次に示す四角形の中央部は、右と左ではいずれも右の方が赤っぽく見えるはずである。緑に囲まれた領域は、本来の色に対して、緑と逆の赤色に見えるのである。上に示した白黒格子と全く同じ理屈である。
 

右と左ではいずれも右の方が赤っぽく見える

 さて、この右下の画像中の赤は通常の「赤」よりもさらに鮮やかな「赤」を実現していることになる。左下のものと同じ赤100%の色であるが、左よりももっと鮮やかに見えている筈だ。右下と比べると、左下の赤は落ち着いた赤色に見えてしまうのではないだろうか?
 この右下の赤、すなわち緑に囲まれた赤は、物理的にCRTあるいは液晶(今あなたがこのWEBページを見ているデバイス)などの表現可能領域を越えた、さらに鮮やかな赤色に見えているわけだ。ヒトの視覚のデバイス特性が故に鮮やかに見えることになる。

 さて、鮮やかな「赤」と言えば、「ポケモンチェック」によれば、日本民間放送連盟のガイドラインには

  1. 映像や光の点滅は、原則として1秒間に3回を超える使用を避けるとともに、次の点に留意する。
    1. 「鮮やかな赤色」の点滅は慎重に扱う。
    2. 前項1の条件を満たした上で1秒間に3回を超える点滅が必要なときには、5回を限度とし、かつ、画面の輝度変化を20パーセント以下に押さえる。加えて、2秒を超える使用は行わない。
  2. コントラストの強い画面の反転や、画面の輝度変化が20パーセントを超える急激な場面転換は、原則として1秒間に3回を超えて使用しない。
  3. 規則的なパターン模様(縞模様、渦巻き模様、同心円模様など)が、画面の大部分を占めることも避ける。
とあるらしい。私は「赤」と「緑」の細かいパターンというのは見ていると、何故だか「チカチカして」気持ちが悪くなるのである。かといって、「赤」と「緑」のパターンであっても、細かくなければクリスマス気分で好きなのである。その証拠にでは、その色使いを使っている位である。パターンが細かくない限りにおいては、緑と赤が鮮やかさを互いに引き立てて良い感じに見えるのである。

 しかし、その「赤」と「緑」パターンが細かくなると、何故だか不快なのだ。色覚の時空間特性を考えると、「赤」と「緑」の細かいパターンというのは、もしかしたら読む際に刺激が強すぎるのではないか、と想像してみたりする。根拠はたいしてないのだけれど。
 

2000-06-28[n年前へ]

カラープリンターの選手宣誓 

ICCファイルを眺めてみよう その2


 ここ数年間にわたって、報告会の前夜遅く(というより当日の朝近く)になると、インクジェットプリンターを並べて発表用のOHTを印刷しまくるという生活が続いていた。「PC使ってプレゼンのソフト使ってやればOHTを出力しなくて済むし楽なのに」と言う人がいるかもしれない。しかし、ただ単純にそう考える人は私は素人だと思う(その理由はいつかまた詳しく書く)。とにかくOHTは必要なのである。

 そういう深夜に大量のOHTを印刷する際に、出力する枚数が数十枚ともなるとインクジェットプリンターでは時間がかかるし、とても大変なのである。かといって、レーザービームプリンターやコピー機はスピードは速いが、カラーのOHTの出力など汚くてできない。そこで、インクジェットプリンターを何台も並べてOHTを出力しまくるという手段に出ることが多い。OHTの出力作業を並列に行うわけだ。

 しかし、そんな時にまた困るのがそれぞれのプリンターの色特性が違うということである。どのプリンターで出力するかどうかで、全然違う色に変わってしまうのだ。下手をすると「こんなのじゃ使えないぞぉ。やり直しだぁ。」というわけで、私の睡眠時間はさらに削られていくのである。
それぞれのカラープリンターの色特性が違うせいで、私の睡眠時間は減るし、腹は減るし、踏んだり蹴ったりなのであった。そういうわけで、私はプリンターの色特性は興味もあるし、恨みもずっと抱いていたのである。「それぞれのカラープリンターからどんな色の出力がされるのか」、というのは私にとってとても大きな問題だったのである。

 と、前振りはここまでで本題に入ろう。前回、

で、
 また、「カラープロファイルで眺める各社のプリンターの性能比較」というような企画でもしてみようかな、とふと思うのであった。
と書いた。今回はその「カラープロファイルで眺める各社のプリンターの色特性比較」を行ってみたいと思う。カラープロファイル・ファイルには「それぞれのカラープリンターからどんな色の出力がされるのか」という情報が書いてあるわけで、そういうことを知っておけばプリンターで出力するときに何かの役に立つはずだ。少なくとも、私の睡眠時間を減らさない程度には役に立つだろう。

 そこで、今回は試しに4機種のレーザープリンターを選んで、それらのプリンター用のカラープロファイル・ファイルに書き込まれている「それぞれのカラープリンターからどんな色の出力がされるのか」という情報を比較してみることにした。カラープロファイル・ファイルの解析には

から入手できるProfile Maker Pro.のデモ版を用いた。

 まずは、この二機種を比較してみよう。世界のhpと日本のキヤノンのカラーレーザービームプリンターである。選んだレーザービームプリンターの機種はHPLaserJet 4500とCanon LBP-2040である。
 

HP LaserJet 4500 と Canon LBP-2040
リンク先は
( http://www.jpn.hp.com/GRP2/bizprt/lj/clj4500/img/photo.jpg )
( http://www.canon-sales.co.jp/Product/LBP/2040-gif/2040_ph.jpg )
HP LaserJet 4500

Canon LBP-2040

 この写真を見ると実はこの二機種は瓜二つである。車で例えれば、TOYOTAのカローラとスプリンターのようにそっくりである。こういう場合、中身は同じであることが多い。カローラとスプリンターが実は中身は同じであるように、この機械もきっと中身は同じなのだろう(確かじゃないけど)。簡単に言えば、OEM製品である。

 この二つのプリンター用のドライバーを各会社のWEBから入手し、カラープロファイル・ファイルを解析してみた。次に示すのが、カラープロファイル・ファイルの中に記載してあったHPLaserJet 4500(左)とCanon LBP-2040(右)の

  • xy空間 ( 上段 )
  • ab空間 ( 下段 )
における出力可能な色空間である。
 
HP LaserJet 4500(左) と Canon LBP-2040(右)
上段 : xy空間
下段 : ab空間
HP LaserJet 4500

Canon LBP-2040

 こうしてみると、大幅に出力可能な色空間が違うことがわかる。中身は同じっぽいのに、出力できる色空間は異なるのである。本当ならば、面白いことだ(どっか解析方法を間違えたかもしれないが...)。ソフト処理の違いだろうか?

 といっても、プリンター用のカラープロファイル・ファイルは結構複雑だし、「カラープロファイル・ファイルに書いてある内容」が必ずしも正しいとは限らないだろう。カラープロファイル・ファイルは単なるそれぞれのカラープリンターの選手宣誓であって、本当のことが書いてあるとは限らないと思う。どちらかが単にホラを吹いているということも考えられる。本来出力できないはずなのに、「いや、オレは出力できるッスよ。」とホラを吹いているということも考えられるわけだ。

 同じようなことを、「勢いにのってる」Epsonと元祖富士XeroxのEpson LP-8500CとFujiXeroxColorLaserWind 3310について行ってみた結果が次である。ちなみに、FujiXeroxColorLaserWind 3310の写真が見つからなかったので、下の写真にはFujiXeroxColorLaserWind 3320PSのものを用いた。
 

Epson LP-8500C(左)とFujiXerox ColorLaserWind 3320PS(右)
リンク先は
( http://www.i-love-epson.co.jp/products/printer/color/
lp8500c/img/n_lp8500.jpg )
( http://www.fujixerox.co.jp/product/color_laser_wind_3320ps/
images/color_laser_wind_3320ps.jpg)
Epson LP-8500C

FujiXerox ColorLaserWind 3320PS

 こちらも、先のHP LaserJet 4500(左)とCanon LBP-2040(右)と同じく、瓜二つである。ということは、これもまた中身は同じモノなのだろう。

 こちらの方の解析した「出力可能な色空間」が以下である。
 

Epson LP-8500C(左)とFujiXerox ColorLaserWind 3310(右)
上段 : xy空間
下段 : ab空間
Epson LP-8500C

FujiXerox ColorLaserWind 3320PS

 この場合には、若干の違いはあるが大体同じであることがわかる。中身が同じで、ソフト部分のみ違うだけだと思うのであるから、当然とも言えるし、少し意外だとも言える。なぜ意外かというと、この二機種は実際に使ってみると結構出力が違うからである。もちろん、出力可能な領域だけでなくて、その内部でどう出力する色を振り分けるかということの方が実は一番重要だったりするので、「意外」というのは言い過ぎかもしれない。

 また、EpsonのLP-8500Cの場合は印刷のモードに合わせて、ICCファイルが複数用意されていた。「それらの間の違い」、すなわち、「印刷モードが違う場合に出力される(あるいはメーカー側が意図している)色空間がどのように違うのか」などは、次回以降に考察してみたいと思う。

 しかし、今回は書いているうちに内容が少しヘビーだと感じ始めた。私には色々な意味で結構難しい内容なのである。まるで空中分解してしまう飛行機のようであるが、ここらへんでいきなり終わりにしておきたい。というわけで、最後にLab空間でのそれぞれ四機種の「自己申告の」出力空間を重ね合わせたものを示してみる。
 

Lab空間でそれぞれの出力空間を重ね合わせたもの

 こうしてみると、Canon LBP-2040以外はどれも似たようなものである。まぁ、どれも同じ電子写真方式なのだから当たり前である。しかし、それでも少しずつ違うことが面白い。逆に、CanonLBP-2040はあまりに違いすぎて、私がどこかを間違えた可能性が大である。

 さて、いきなり冒頭の話に戻る。私は気分的には「報告会 = 試合」だと思っている。自分の戦力のどこが強くてどこが弱いかを意識しながら、最善を尽くしたい、と思っているわけだ。さらに言えば、自分の戦力のどこが強くてどこが弱いかが判っていれば、例え勝てないにしても、善戦はできると思っている。だから、前回

 icmファイル(カラープロファイルファイル)には、それぞれのディスプレイの出せる「色空間」が書かれている。言わば、それぞれのディスプレイの「守備範囲」が書かれている。それぞれのディスプレイにそれぞれの「守備範囲」がある。それぞれのディスプレイやプリンタ達の「ここの範囲ならまかせとけ」という範囲である。

 その守備範囲をちゃんと知ってさえいれば、「少ない戦力でも勝つこと」ができるかもしれない。

と書いたように「どんなことができるか」を知るのはとても大切だと思っている。カラープロファイル・ファイルには「何ができて、何をしようとしているか」が書いてあるわけで、それはちょうどプリンター達の「選手宣誓」のようなものである。当然、試合の前には「選手宣誓」が必要だろう。

 えっ、何を言いたいか判らないって?とりあえず、今回は「カラープロファイルで眺める各社のプリンターの性能比較」を始めるぞ、という私の「選手宣誓」である。話の本筋に入るのは次回以降ということにしておきたい。
 



■Powered by yagm.net