2008-11-13から1日間の記事一覧

はてな流大規模データなんたら

自然言語処理などは全然知らない世界だが、検索アルゴリズムにベクトル空間モデルというのがあるようでちょっと興味を持った。たとえば文書の単語の出現回数などをベクトル成分とみなし、ベクトル同士の角度が小さい(cosθが1に近い)ほど類似している文書で…