どうも、こんばんは。

今週末も特に予定が無いので仕事をすることに決めました。仕事命のいとらーです。

今宵は少し頭を使った文章を書く予定なのでまだアルコールには手を付けていません。横にはあります。

今回話したいのは、「Amazonの検索機能は脆弱である」ということです。

先日セラーフォーラムでも話題になっていました。

在庫管理機能がおかしくないですか?

少し引用させていただきます。

おそらくamazonで売上低迷が起こった9月~10月あたりから当店では在庫管理の検索機能に不具合が発生しております。

以前なら在庫管理画面の検索フォームに商品名の一部を入力すれば関連する商品が全て出てきたのですが今は一部のワードだけでは関連の商品が出てきません。

たとえば「仮面ライダー◯◯」という商品があったとします。

以前なら「仮面ライダー」とだけ検索フォームに入力すれば「仮面ライダー◯◯」という商品も検索結果に出てきていました。

しかし今は「仮面ライダー◯◯」と入力しないと出てきません。

「プリキュア」➡検出されず
「ハピネスチャージプリキュア」➡検出される(以前は「プリキュア」だけで検出された)

「トランス」➡検出されず
「トランスフォーマー」➡検出される(以前は「トランス」だけで検出された)

「ミク」➡検出されず
「レーシングミク」➡検出される(以前は「ミク」だけで検出された)

商品名「京商 1/10 電動2WDバギー EZシリーズ サンドマスター レーシングミク 2014バージョン」

この商品を「ミク バギー」で検索しても検出されません。(以前はこれで出てきたはずですが違う商品が出てきます)
「レーシングミク バギー」で検索しないと出てきません。(「初音ミク バギー」でもでてきません)

などなどです。

自分はコミックセットのデータを1万件ほどリサーチしてツールに格納して行ったのでこの悩みは良く分かります。

コミックセットの有名なものはタイトルの一部でも検索にかかるのですが、あまり有名ではないものはタイトルの一部だけだと引っ掛かりません。そこで、全てのタイトルを入力する必要が出てきてとても面倒なのです。

そこで、自分なりにこのフォーラムの問題について考えてみました。といっても素人考えなので当てにされても信用されても困りますのでそこのところはよろしくお願いします。

1、まず前提として、Amazonのデータベースに入っているのは、「タイトル」と個別に登録した「検索キーワード」だと思います。

ここから、検索者が検索窓に入力した文字とデータベースの文字列が一致したものを表示します。これはイコールで結び付けば表示される最も簡単な検索。

2、次に、入力したキーワードが一部分の場合について

「トランスフォーマー」という商品を検索するときに、「トランス」と入力した場合。

まずは、Amazonのデータベースにはトランスフォーマーという文字列しか入っていないとしましょう。

ここで、私が言っているのは、「文字列」ということです。

つまり、「ト」「ラ」「ン」「ス」「フ」「ォ」「-」「マ」「-」という文字がデータベースに入っているだけです。

我々はトランスフォーマーとという言葉を聞いたときに「トランス」=変形、「フォーマー」=形態というような意味を持つ言葉に無意識に分解しています。

しかし、このような重みづけというは基本的にはコンピューターは出来ないと思っています。恐らくですけど。少なくともアマゾンのデーターベースでは。

そこで、文字列を色々な部分で切って、一致しないかをチェックします。例えば、「トランス」という文字がタイトルの文章の途中に現れないかなどです。

トランスフォーマーの場合は一番初めにトランスと出てくるので簡単なように思えますが、無数にあるタイトルの中から、「ト」「ラ」「ン」「ス」ということばを見つけるのは結構大変=負荷がかかるということになるのではないのかと思います。

そう、負荷です。

Amazonはもしかしたら、負荷軽減のために検索する場合のキーワードの切り方を変えたのではないか、もしくは切るのを辞めた可能性もあるのではないかなと思います。

負荷がかかるというのは、もちろんAmazon自体のデータが増えたり、機能が増えたりすることで起こりますが、これは自分でサーバーを増強する必要性があるということなど対処可能です。

これとは別に何らかのサイバー攻撃などを受けていて意図しない高負荷状態になることが増えたという可能性も捨てきれないような気がします。

理由はいずれにせよ、この検索するときの文字列のカットの機能が弱っているかなくなったんだと思います。

その証拠に引用した3つ目のケースです。

「京商 1/10 電動2WDバギー EZシリーズ サンドマスター レーシングミク 2014バージョン」

というタイトル。

「ミク バギー」では出てきません。それは、「レーシングミク」という一連の文字列から「ミク」を切り取ることが出来ていないからです。

一方で、「レーシングミク」は検出される。これは、タイトルの中にしっかりと「レーシングミク」という一連の文字列の塊がそのまま入っているからでしょう。

「レーシングミク」の前後にはスペースが入っていて、文字列の一つ一つの塊を判別しやすく=切り分けやすくされていることが分かります。

このような場合ではタイトルの全体を入力しなくても結果を出すことが出来るわけです。

そして、これはどういうことか?

これは要は英語などの言語のように単語間をスペースを空けて文字を入力する言語体系の処理なのです。

だから、日本よりも英語の文章の検索は容易ですし、負荷が軽いのだと推測されます。

このトピックがフォーラムで話題になった時は、きっと英語用のプログラムでしのいだのではないのかなと勝手に思いました。

対策

ここまでが勝手な状況の分析なので、はっきりいってセラーからすれば、「じゃあどないせぇちゅうねん」という話です。

また同じような問題が起きたときは一番早いのは詳細の編集から「キーワード」を登録しておくことだと思います。

そうすれば、入力した文字列がキーワードに登録されたワードと一致しているかどうかの判断位はしているでしょうから早いと思います。

それ以外は、もうアマゾンに検索システムを強くしてもらうしかないでしょう。

しかし、アメリカのシステムを日本語体系に持ち込む時の難しさ、苦労なんかを考えると時間のかかることだなぁと思います。

日本人なら当たり前にわかる助詞の「は」や「が」もコンピューターからしたらただの「は」と「が」ですからね。

「は」の前の言葉が何らかの意味のある文字列だと判断できるのは日本人が「慣れ」でやっていることですから。

しかも、「は」自体が助詞であることを判断することも難しいので、すべての「は」の前後の言葉を抽出するのも面倒ですよね。
負荷がかかる仕組みになるんだと思います。

まぁアメリカ仕込みのプラットフォームで商売させていただいているので仕方のない部分かなと思いました。
それよりも、せっせこ「キーワード登録」をして微力ながらアマゾンの向上に貢献出来たらなと思います。

それでは。

あ~やっと酒が飲める。