y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

自前でgeocodingの手順

自前ジオコーディングまでの流れをまとめる。

■街区レベル位置参照情報の加工
都道府県名、市郡区町村名、丁目、番地に分かれている住所フィールドを結合する。

■テーブル内の住所整形
参考:
http://groups.google.co.jp/group/Google-Maps-API-Japan/browse_thread/thread/34a383696456b4ae
http://www.addressmatch.jp/rule.html

・漢数字を半角数字にする
・ローマ数字を半角数字にする
・ケケガガ→ヶ
・ノノ→の
・ツツっッッ→ッ
・英数字を半角大文字にする
・"丁目" →"-"
・"番地"、"番" →"-"
・"--"→"-"、最終の-を削除

■クエリの書き換え
上記、ルールに合わせてクエリを書き換える

■複数検索による検索漏れの回避
・指定されたクエリ文字列に一致するかどうかで検索
・末尾から1文字ずつ削除して再検索を繰り返す
・結果が得られたら最上位の1件だけ返す