01.Blogs :
nosemako  
チラシの裏の日記帳

真面目に勉強をすると、変なことを考えてバランスをとりたくなる

主語とか大事な部分を省略して言うと、プログラマとか目指している人が多いと思うんですよ。
でも、「じゃあそのプログラムで何を書くのよ?」ってことになる。そこらへんのことも勉強しているわけですよ、今。やりたくもないのに。
SVMっていうアルゴリズム? があるんですよ。Support Vector Machineっていうんですけれどね。集合を2つに分けるシステムなんですが、これがかなり難しい。数式が何を書いているのかわからない。でもそれを勉強して理解しないといけない現実。何とか理由をつけて逃げれないものかなあ。
また話それた。
で、そのSVMってのはようするにAとBの集合を直線で分けるってもんなんです。例えばオタクと一般人を分けたい場合、「アニメは見ているか」「同人誌は持っているか」「jpgファイルを大量に持っているか」「眼鏡をかけているか」とかいろいろな要素に、オタクなら+1、一般人なら-1の重み付けをするんです。で、その人が当てはまるものに○をつけて、○に重み(+1か-1)をかけるんです。その結果が+ならオタク、-なら一般人となります。0にならない限り、必ずどちらかに割り振られる分類法なわけですな。
詳しく知りたい人は調べてみてください。実際に既存のプログラムを動かしてみると面白いかもしれません。俺は動かしたことないですが。

たまにはテクニカルな話をしてみるtestnoseです。惚れた? ギャップに惚れた?

そのSVMですが、要素の数を減らすことが重要になってくるんです。1000個の質問で答えが出るより、100個の質問で答えが出たほうが効率いいでしょ?
それを簡略化とか素性数の減少とか次元の削減とかいうんです。少なければ少ないほどいい。
ここんとこ重要。「次元の削減」。
つまり、次元は削減できるだけした方がいい。無駄なものは極力削除するべき。そして次元が低い方が優秀。
ゆえに、3次元よりも2次元の方が優秀で高潔である。QED.

とかそんなことを考えていましたが、実際に文章にしてみると面白くないですね。
やっぱり簡潔な文章ほど破壊力があるんでしょうな。多分、最も尊敬する作家さんは星新一さんです。本は2冊くらいしか持っていませんが。
逆に改行とか行間とかあけまくって、縦に長い方が読みやすくてネタが通じ易いかもしれないですね。と友人のブログを見ていて思いました。でも書き方変えないと思います、俺は。読みにくくてわかりにくいのを「これが個性だよ! わかろうと努力しなさい!」というような人ですよ俺は。すんません調子乗ってました。俺はどうしようもなくウミウシですー!

ウェブ拍手:これは 単なる

posted on Sunday, July 23, 2006 2:14 AM by nosemako


 
03.UPDATE CALENDAR :
<July 2006>
SunMonTueWedThuFriSat
2526272829301
2345678
9101112131415
16171819202122
23242526272829
303112345

05.MY LINKS :

07.Subscriptions :

Subscriptions


© Copyright 2005 Microsoft Corporation. All Rights Reserved.
Terms of Use | Privacy Statement | Code of Conduct | Hosted by MaximumASP for Microsoft
WHO-BAR