【読了時間:5分】
みなさん、はじめまして!!
Sengoku Labインターン生の宮本と申します。本日よりこのブログで、インターンシップを通じて学んだことを随時更新させていただきます。
一連の記事を通じて、プログラミングや地理情報解析を全くやったことのない人が徐々にソフトやコードを扱えるようになっていければ幸いです。よろしくお願いします。
第1回目となるこの記事では、地理情報を取り扱うにあたって大切な道具である「プログラミング言語」と「GISソフト」について取り上げたいと思います。
それでは早速、順番に見ていきましょう!
プログラミング言語
人口データや交通データといった、現在取り使われている地理データは、複雑・大量なものばかりです。手作業ではとても編集し切れません。
そこで、私たちはプログラミング言語を習得し、コードを実行することによってコンピュータに演算させることになります。
プログラミング言語には様々ありますが、初心者の方はまずPythonを習得することがおすすめです。pythonは視認性にすぐれ、英語に近い語彙を用いて書くことができます。
Anacondaと呼ばれるインストーラを用いてpython(とその他の付属物)をインストールすることがおすすめです。
Pythonでは様々なことができますが、データサイエンスに特化した学習サイトは、
Lectures in Quantitative Economics
などがおすすめです(Anacondaのインストール方法も載っています)。
どちらも基礎から学ぶことが出来るので、プログラミングを全くやったことが無くても大丈夫です。なかでも、Numpyと呼ばれる高速演算のモジュール(道具)と、Pandasと呼ばれる表計算のモジュールの習得は重要です。
なお、2つめのリンクは発展的な内容もカバーしておりますので、まずは1つめのリンクをひと通り学習し、次に2つめへ進むことをおすすめします。
※最近はGoogle Colaboratoryと呼ばれる、Googleが提供するPython実行環境もあります。今後、以上で紹介したローカル(手持ちのPC)での環境構築が不要になるかもしれません。これについてはまた改めて紹介したいと考えます。
GIS
GIS(Geographic Information System)は、地理情報付きのデータを可視化することに優れたソフトです。
たとえば、以下のような出力をすることが容易です!いわゆる「ドーナツ化現象」が起きていることが、すぐわかりますね。便利!!
GISには様々な種類のソフトがありますが、中でもフリーでオープンソースである「QGIS」がおすすめです。
QGISは2018年の3月に新バージョンである3.0がリリースされ、最新バージョンは3.0.1です。
2つの道具の役割分担
GISは可視化に優れている一方で、大量のデータを演算するのには不向き(すぐに処理落ちしてしまう)です。またpythonで思い通りの可視化をするには、若干の複雑なコードを理解する必要があります。
ですので慣れないうちは、データの加工にはpythonを使い、出来上がったデータをGISで可視化するという役割分担が大切かと思われます。
つまり、
- 「複雑で大量の計算はプログラミング(コード)で実行する」
- 「計算結果を地図に可視化するにはGISを使う」
という大原則が大切です。
地理情報を扱うスターターキットとして、まずはpython(anaconda)とQGISをインストールしましょう!!!
執筆:宮本