GTFS

GTFSとは

https://developers.google.com/transit/gtfs/?hl=ja より,

GTFS(General Transit Feed Specification)には、公共交通機関の時刻表とその地理的情報に使用される共通形式が定義されています。GTFS の「フィード」を利用することで、交通機関は乗換案内データを公開し、デベロッパーはそのデータを相互運用可能な方法で利用するアプリケーションを作成することができます。

作成したフィードをGoogleに送ると,Googleマップのルート検索に反映されるらしい. 秋田県内だとあまり整備されていないが,シドニーにいた頃は大変お世話になった.

フィードの作成

  • フィードは複数のテキストファイルをzipで固めたもの
  • テキストファイルのエンコーディングはUTF8

フィードに含まれるテキストファイルは以下の通り(https://developers.google.com/transit/gtfs/reference?hl=ja から抜粋)

ファイル名 必須 定義
agency.txt 必須 このフィードのデータを提供する 1 社以上の交通機関.
stops.txt 必須 乗客が乗り降りする停車地点.
routes.txt 必須 交通機関のルート.ルートとは利用者に 1 つのサービスとして表示される,旅程のグループのことです.
trips.txt 必須 各ルートの旅程.旅程とは一定の時間に 2 回以上の停車を伴う移動行程を指します.
stop\_times.txt 必須 各旅程の個々の停車地への到着時刻と出発時刻.
calendar.txt 必須 週間時刻表に基づいたサービス ID の日付.サービスの開始日と終了日に加えて,サービスが利用できる曜日を指定します.
calendar\_dates.txt 省略可能 calendar.txt ファイルで定義されたサービス ID の例外.この calendar\_dates.txt にサービスのすべての日付を含める場合,calendar.txt の代わりにこのファイルだけを指定することも可能です.
fare\_attributes.txt 省略可能 交通機関のルートの料金情報.
fare\_rules.txt 省略可能 交通機関のルートの料金情報を適用するための規則.
shapes.txt 省略可能 交通機関のルートを示す線を地図に描くための規則.
frequencies.txt 省略可能 サービスの間隔が一定でないルートの運行間隔(旅程の間隔).
transfers.txt 省略可能 乗換地点で別のルートに乗り継ぐための規則.
feed\_info.txt 省略可能 フィード自体に関するその他の情報(フィード提供者,バージョン,有効期間などの情報).

サンプルは https://developers.google.com/transit/gtfs/examples/gtfs-feed?hl=ja を参照のこと(すぐに試せるzipで固めたものも入手可能).

stops.txtの作成

乗客が乗り降りする停車地点を表し,フィードに必須. 詳細は https://developers.google.com/transit/gtfs/reference?hl=ja#stops_fields を参照のこと.

[フィードの例](https://developers.google.com/transit/gtfs/examples/gtfs-feed?hl=ja)のstops.txtの内容を抜粋のstops.txtの内容を抜粋)

```txt stop_id,stop_name,stop_desc,stop_lat,stop_lon,zone_id,stop_url FUR_CREEK_RES,Furnace Creek Resort (Demo),,36.425288,-117.133162,, BEATTY_AIRPORT,Nye County Airport (Demo),,36.868446,-116.784582,, BULLFROG,Bullfrog (Demo),,36.88108,-116.81797,, STAGECOACH,Stagecoach Hotel & Casino (Demo),,36.915682,-116.751677,, NADAV,North Ave / D Ave N (Demo),,36.914893,-116.76821,, NANAA,North Ave / N A Ave (Demo),,36.914944,-116.761472,, DADAN,Doing Ave / D Ave N (Demo),,36.909489,-116.768242,, EMSI,E Main St / S Irving St (Demo),,36.905697,-116.76218,, AMV,Amargosa Valley (Demo),,36.641496,-116.40094,, ``` 必須なのは,以下の4つ( https://developers.google.com/transit/gtfs/reference?hl=ja#stops_fieldsから抜粋).

stop\_id 必須 stop\_id フィールドには停車地や駅を一意に識別する ID を指定します。複数のルートに同じ停車地を使用できます。stop\_id は一意なデータセットです。
stop\_name 必須 stop\_name フィールドには停車地や駅の名前を指定します。その地域の住民や旅行者が理解できる名前を使用してください。
stop\_lat 必須 stop\_lat フィールドには停車地や駅の緯度を指定します。値には有効な WGS 84 の緯度を指定します。
stop\_lon 必須 stop\_lon フィールドには停車地や駅の経度を指定します。値には有効な WGS 84 の経度値(-180~180)を指定します。

バス停の位置情報を取得

[国土数値情報バス停留所データ](http://nlftp.mlit.go.jp/ksj/gml/datalist/KsjTmplt-P11.html)を用いて,バス停の位置情報を取得するを用いて,バス停の位置情報を取得する). 国土数値情報についてはqgis を参照のこと. なお,座標系を国土数値情報で用いられているJGD2000からGFTSで用いられているWGS84に変換する必要があるが,2014/12/03時点では未着手.

国土数値情報バス停留所データをCSVに変換する

1. ダウンロードしたzipファイルを解凍 2. シェイプファイルをベクタレイヤとしてQGISで読み込む(エンコーディングはShift_JIS,座標系はJGD2000).秋田県のシェイプファイルはP11-10_05-jgd-g_BusStop.shp 3. レイヤパネルからレイヤを右クリックし,「名前を付けて保存」で「コンマ区切りファイル」形式を選び,P11-10_05-jgd-g_BusStop.csvとしてCSVでエクスポート(以下に秋田県の2行だけを抜粋)

```csv X,Y,P11_001,P11_002,P11_003_1,P11_003_2,P11_003_3,P11_003_4,P11_003_5,P11_003_6,P11_003_7,P11_003_8,P11_003_9,P11_003_10,P11_003_11,P11_003_12,P11_003_13,P11_003_14,P11_003_15,P11_003_16,P11_003_17,P11_003_18,P11_003_19,P11_004_1,P11_004_2,P11_004_3,P11_004_4,P11_004_5,P11_004_6,P11_004_7,P11_004_8,P11_004_9,P11_004_10,P11_004_11,P11_004_12,P11_004_13,P11_004_14,P11_004_15,P11_004_16,P11_004_17,P11_004_18,P11_004_19 140.06536198,39.62948181,長浜,“3,1”,“秋田市,羽後交通(株)”,,,,,,,,,,,,,,,,,,,“下浜線,(急行)本荘・秋田線”,,,,,,,,,,,,,,,,,, ``` 左から順に,経度,緯度,バス停名,バス路線情報バス区分,バス路線情報事業者名...となる. 同一バス停に複数路線が乗り入れている場合,バス路線情報(バス区分・事業者名・バス系統)が二重引用符『“』でくくられ,その中でカンマ区切りで列挙される.

バス会社Aのみを抜き出す

<del>P11-10_05-jgd-g_BusStop.csvをVimで開き,ノーマルモードで以下の操作を行い,「バス会社A」が含まれる行をqレジスタにヤンクする ``` /バス会社A qqq:g//y Q ```

新規バッファを開き,ノーマルモードで以下の操作を行い,qレジスタの内容を貼り付ける

``` “qp ```

適当な名前でファイル(ここでは仮にBusStop.csvとする)を保存する.</del>

awkをつかえば,もっと簡単だった([この記事](http://antibayesian.hateblo.jp/entry/2014/09/15/162605))

``` awk /バス会社A/ P11-10_05-jgd-g_BusStop.csv > BusStop.csv ```

必要な情報のみを抜き出す stops.txtに必須のstop\_id, stop\_name,

stop\_lat, stop\_lonのうち,stop\_id以外の3つはBusStop.csvに含まれている.

awkを使って,BusStop.csvに含まれるバス停名称,緯度,経度を抜き出し,結果をstops.txtに書き出す.

```awk awk -F”," ‘{ print $3 “,” $2 “,” $1}’ BusStop.csv > stops.txt ```

stop_idの生成

面倒なので,上から順番にS0001,S0002...といった連番にする. QGISなら,フィールド計算機で ```format (‘S%1’, lpad($rownum, 4, ‘0’) )``` といった具合にすればよい.

以下の記述は念のために残しておく.

エクセルのふりがな作成機能を使ってバス停名称にふりがなをつけ,それを英字にしてIDとする.※同一名称のバス停がある(該当するバス停を使う路線もくっつれば対応可能だと思う)

ふりがなを振る

ふりがなを振りたいセルを選択し,Alt + Shift + 矢印の上でふりがなが振られる. しかし,複数セルに対して一括では行えないので,マクロを使う.

```vba Sub 振り仮名を付ける()

  Selection.SetPhonetic
  Range("A1").Select

End Sub ```

ふりがなを振りたいセルを選択して上記のマクロを実行すれば,一括でふりがなが振られる. なお,後述する半角カタカナからローマ字への変換のため,「ふりがなの設定」で半角カタカナを選択しておくこと.

ふりがなを取り出す

  • PHONETIC関数を使って,ふりがなをB列に取り出す(例えば,B1セルに=PHONETIC(A1)と入力して,セルの右下をドラッグ)

ふりがなを半角カタカナから英字に変換する

  • kana2roma_4.xls内で定義されているRomanConv関数を使って,ふりがなを半角カタカナから英字に変換する(例えば,C1セルに=RomanConv(B1)と入力して,セルの右下をドラッグ)
  • C列全体をコピーし,stops.txtのA列に「形式を選択して貼り付け」で値のみを貼り付ける

ヘッダーの記述 1行目に, ``` stop_id, stop_name, stop_lat,

stop_lon ``` を追加

shapes.txtの作成

shapes.txtは交通機関のルートを示す線を地図に描くための規則で,省略可能(が,無いとバス停間を直線で結ぶことになる).

詳細は https://developers.google.com/transit/gtfs/reference?hl=ja#stops_fields を参照のこと.

[フィードの例](https://developers.google.com/transit/gtfs/examples/gtfs-feed?hl=ja)のshapes.txtの内容を抜粋のshapes.txtの内容を抜粋)

```txt shape_id,shape_pt_lat,shape_pt_lon,shape_pt_sequence,shape_dist_traveled A_shp,37.61956,-122.48161,1,0 A_shp,37.64430,-122.41070,2,6.8310 A_shp,37.65863,-122.30839,3,15.8765 ```

必須のフィールドは以下の4つ(https://developers.google.com/transit/gtfs/reference?hl=ja#shapes_fields から抜粋)

shape\_id 必須 shape\_id フィールドには、1 つのシェイプを一意に識別する ID を指定します。
shape\_pt\_lat 必須 shape\_pt\_lat フィールドを使用して、シェイプ ID にシェイプ ポイントの緯度を関連付けます。値には有効な WGS 84 の緯度を指定します。shapes.txt の各行が、シェイプを定義する 1 つのシェイプ ポイントを表します。
shape\_pt\_lon 必須 shape\_pt\_lon フィールドを使用して、シェイプ ID にシェイプ ポイントの経度を関連付けます。値には有効な WGS 84 の経度値(-180~180)を指定します。shapes.txt の各行が、シェイプを定義する 1 つのシェイプ ポイントを表します。
shape\_pt\_sequence 必須 shape\_pt\_sequence フィールドを使用して、シェイプ ポイントの緯度と経度をそのシェイプに沿った進行順序に関連付けます。shape\_pt\_sequence の値には 0 以上の整数を使用し、旅程の進行に合わせて値を増やします。

たとえば、シェイプ「A_shp」の定義に 3 つのポイントが含まれる場合、shapes.txt ファイルにはこのシェイプを定義するために次のような行を指定します:

  • A\_shp,37.61956,-122.48161,0
  • A\_shp,37.64430,-122.41070,6
  • A\_shp,37.65863,-122.30839,11

省略可能なフィールドとして,shape\_dist\_traveledがある

テキストファイルをzipで固める

余計なサブディレクトリが出来ないように気をつける必要がある.

Macで圧縮する場合,[WinArchiver Lite](https://itunes.apple.com/jp/app/winarchiver-lite/id414855915?mt=12)に全テキストファイルをドラッグするか,以下のようにコマンドラインで圧縮するに全テキストファイルをドラッグするか,以下のようにコマンドラインで圧縮する).

``` zip -r feedname *.txt ```

Windows7の場合は全てのテキストを選択して右クリック,「送る」「zipで圧縮」みたいな感じで大丈夫

作成したフィードの検証

インストール

```sh cd git clone https://github.com/google/transitfeed.git ``` makeが上手くいかないので,pythonスクリプトをそのまま使う.

Windowsなら,コンパイル済みのものが公開されているので,https://github.com/google/transitfeed/releases/download/1.2.13/transitfeed-windows-binary-1.2.13.zip からダウンロードして,解凍すればOK.

地図上での表示のされ方を検証

作成したフィードを適当な場所に保存(以下はtransitfeedの下にfeedsディレクトリを作成して,そこにtest.zipを保存した場合)し,スクリプトを実行する.

``` cd ~/transitfeed/ python ./schedule_viewer.py –feed_filename feeds/test.zip ``` Webサーバが立ち上がるので,ブラウザで http://localhost:8765/ にアクセス

もし,ImportError: No module named simplejsonというエラーが出たら, ``` easy_install simplejson ``` でsimplejsonをインストールする.

仕様に準拠しているかどうかを検証

``` python ./feedvalidator.py feeds/test.zip ```