Google Colaboratoryの使い方¶
Google Colaboratory(通称:Colab)とは、Googleが提供する、開発者向けの無料のクラウドサービスです。 ブラウザ上でPythonのコードを記述・実行できるJupyter Notebook環境が提供されており、 特に機械学習やデータサイエンスの分野で広く利用されています。
Google Colabを利用するには、Googleアカウントが必要です。ログインした後に、以下のURLを開いてください。
-
Googleドライブのあるノートブックを開きます
-
Googleドライブの「マイドライブ」→ 「Colab Notebooks」の下にノートブックを新規作成します。
デフォルトでは「Untitled.ipynb」と言うファイル名になります
Google Colabのファイルを、「Colabノートブック」「ノートブック」等と呼びます。 ノートブックには ipynb という拡張子(エクステンション)が付きます。
Google Colabの特徴の主な特徴・できること¶
環境構築が不要:
Pythonの実行環境や、機械学習によく使われるNumPy、pandas、TensorFlowなどのライブラリがプリインストールされているため、面倒な環境構築なしにすぐにプログラミングを始めることができます。
無料でGPU/TPUが利用可能:
高度な機械学習やディープラーニングではGPU(Graphics Processing Unit)やTPU(Tensor Processing Unit)といった高性能な計算リソースが不可欠ですが、Colabではこれらを無料で利用できます(時間制限あり)。これにより、個人のPCスペックに左右されずに、重い計算を効率的に実行できます。
(有料版あり)
共同編集・共有が簡単:
Google ドライブにノートブックが保存されるため、他のユーザーと簡単に共有し、リアルタイムで共同編集することができます。教育現場やチームでの開発に非常に便利です。
対話型プログラミング: Jupyter Notebookベースであるため、コードをセルごとに記述・実行し、その場で結果を確認しながら開発を進めることができます。グラフや図表もノートブック内に直接表示されるため、データの傾向や分析結果を素早く把握できます。
AIアシスタント機能:
コードの生成、概念の説明、エラーの修正など、AIを活用した機能も提供されています。
Google Colabのメリット¶
手軽にPythonを始められる:
環境構築の手間がないため、プログラミング初心者でも気軽にPythonや機械学習を学び始めることができます。
コストがかからない:
無料で高性能な計算リソースを利用できるため、GPUなどを購入する費用を抑えられます。(有料版もあります)
共同作業がしやすい:
共有機能が充実しており、複数人でのプロジェクトや学習に適しています。
Google Colabのデメリット・注意点¶
ランタイムのリセット:
一定時間(90分や12時間など)操作がないと、実行環境(ランタイム)がリセットされ、メモリ上のデータや実行結果が消えてしまいます。長時間の学習を行う場合は注意が必要です。(有料版では緩和されます)
PCのファイルを直接扱いにくい:
ローカルのファイルを直接扱うには、Googleドライブへのアップロードやマウントが必要です。
有料版との機能差:
無料版でも十分な機能が提供されていますが、より高性能なGPUの利用、メモリ容量の増加、長時間実行などは有料版(Colab Proなど)で提供されます。
インターネット環境が必須:
クラウドサービスのため、インターネット接続がないと利用できません。
Google Colabの使用制限¶
「Google Colab」は基本的には無料で使えるが主に下記の制限がある
RAM:12GB
ディスク:CPU/TPC:最大107GB、GPU:最大68GB
90分ルール : 何も操作せずに90分経つとリセット
12時間ルール : インスタンスが起動してから12時間経つとリセット
有料版のGoogle Colab Proにすると、制限を緩和することができる
Colab Pro:月額1,179円
Colab Pro+:月額5,767円
Colab Enterprise:カスタム
Jupyter Notebook¶
Jupyter Notebook(ジュピターノートブック)は、Webブラウザ上でPythonなどのプログラミング言語のコードを記述、実行、そしてその結果を視覚的に表示できるオープンソースのWebアプリケーションです。ローカルのPC上に環境を構築して使用します。 特にデータ分析、機械学習、科学計算、教育といった分野で広く活用されています。
Google Colabは、Jupyter Notebookベースで作成されています。
Jupyter Labというものもあります。 Jupyter LabJupyterは、Jupyter Notebookの「次世代版」とも言える統合開発環境(IDE)でJupyter Notebookと後方互換性があります。Jupyter Notebookの持つ対話的なノートブック機能を継承しつつ、より多機能で柔軟な作業が可能になります。通常であればJupyter Notebookでも十分な機能となってます。
ローカルでのPython環境構築ガイド¶
ローカルでPython環境を構築する場合や自分でJupyter Notebook環境を構築する場合は、日本のPythonコミュニティが運営しているPython.jp のPython環境構築ガイド参考にしてください
Python環境構築ガイド: https://www.python.jp/install/install.html
Google Colabの使用方法¶
Colaboratory(通称 Colab)によるノートブックの操作方法について説明します
Google Colabの起動¶
Googleドライブを開きます。
Googleドライブ https://drive.google.com/
Googleアカウントでログインした状態でアクセスすると次のような画面になります。ログインしてない場合はログインをしてください。 (Googleアカウントをお持ちでない方は、新規にアカウントを作成してください)
Google Colabを起動します
コードセルもしくはテキストセルを追加し入力します
画面名称¶
セルには「コードセル」と「テキストセル」の2種類があります
コードセルにPythonのコードを書いて実行します。
テキストセル:Markdown記法で文章やコメントを入力します。Word等を同等に見出しをつけたり、画像を挿入したりすることが可能です
青枠: ここをクリックすると逐次(ちくじ)空のコードセルまたはテキストセルが追加される
赤枠: テキストセル
緑枠: コードセル
コードセルの実行¶
ノートブックはセルから成り立っています。 主に次の二種類のセルを使います。
Codeセル(コードセル): Pythonのコードが書かれたセルです。 Codeセルの左端には [ ] と表示されています。 Codeセルの中のコードを実行するには、 [ ] のところにマウスカーソルを移動してクリックします。 [ ] のところにマウスカーソルを移動すると、●の中に▷が表示されます。 これはプレイボタンを意味します。 プレイボタンを押すとコードが実行され、その結果がセルの下部に挿入されます。 (Shiftを押しながらEnterを押しても実行できます。)
Markdownセル(テキストセル): 説明が書かれたセルです。 このセル自身はMarkdownセルです。
コードセルでPythonを実行する場合は、この実行マークをクリックする または セルを選択してから Shift+Enter します
セルの編集¶
Codeセル上のプレイボタンでないところにマウスカーソルを移動しクリックすると、 Codeセルが選択され、文字カーソルが表示されて、セルの編集が可能になります。 Ctrlの付かない文字はそのまま挿入されます。
以下のような編集コマンドが使えます。
Ctrl+c: copy
Ctrl+x: cut
Ctrl+v: paste
Ctrl+z: undo
Codeセルが選択されているとき、Shift+Enter(もしくはShift+Return)を入力すると、 セルの中のコードが実行されて、次のセルが選択されます。
ノートブックの保存¶
ファイルメニューから「ドライブにコピーを保存」をクリック、ノートブックを保存します
Googleドライブ内に「Colab Notebooks」というフォルダが自動で作られ、その中にノートブックが保存されます
Google Colabのノートブックファイル(.ipynb)のダウンロード¶
「ファイル」→「ダウンロード」→「.ipynbをダウンロード」を選択して、ノートブックファイル(.ipynb)をパソコンにダウンロードしまします
Google Colabのノートブック新規作成¶
Google Colabのノートブックを新規作成する
「新規」を選択
「その他」→ 「Google Colaboratory」を選択して新規作成する
「Google Colaboratory」メニュー項目が無い場合¶
「Google Colaboratory」メニュー項目が無い場合は、「Google Colaboratory」のアプリをインストールする
「新規」→ 「その他」→ 「アプリを追加」を選択
「Google Workspace Marketplace」で 「Google Colaboratory」を検索
検索結果で「Google Colaboratory」が表示されたらクリックして「Google Colaboratory」アプリをインストール
Googleドライブのマウント¶
ノートブックから、Googleドライブ内のファイルを読み書きする場合は、Googleドライブのマウントをする必要があります。
Googleドライブのマウントは下記のコードをセルに入力して実行します.
from google.colab import drive
drive.mount('/content/drive')
例)
実行
この実行マークをクリックする または セルを選択してから Shift+Enter します
ファイルへのアクセスを確認するダイアログが表示されますので、「Googleドライブに接続」を押します。
アカウントへのリクエストが表示されます。「許可」をクリックします。
このダイアログが表示されたら「次へ」をクリックします。
次のダイアログでは「続行」をクリックします。
コード実行後、「Mounted at /content/drive」と表示されます。
Google ドライブのフォルダが追加される。
実行した際に作成されるcsvファイルは、画面左端のフォルダのマークを選択する
/content/driveの下にGoogleドライブのファイルがなどが表示されます。そこらからCSVファイル等を読み込み/書き込みをします
マウスクリックでマウント
マウスから直接マウントする場合は下記で行います
ファイルのアップロード¶
ノートブックの仮想環境のセッションストレージにファイルをアップロードします
フォルダメニューを選択
右マウスでフォルダを選択してメニューを表示
「新しいフォルダ」を選択
「Untitled Folder」というフォルダが作成される
フォルダ名「data」をキー入力
「data」フォルダにアップロードするファイルをドロップする
アップロードデータはセッションが終了すると消える
注意書きを読んで「OK」ボタンをクリック (表示されない場合もある)
「data」フォルダにファイルがアップロードされる
ノートブックから”/<フォルダ名>/<ファイル名>”でアクセスする
例)"data/FEH_00200524_230205124938.csv"
仮想環境のディレクトリ構造¶
初期表示時は、仮想環境のディレクトリは省略されて表示されている 矢印の位置をクリックすると、フルディレクトリーが表示される
「content」ディレクトリの直下がノートブックのカレントディレクトリとなる
セッションが多すぎますと表示される¶
Google Colabの実行ボタンを押すとセッションが多すぎますと表示されてしまう場合がある
その場合は、不要なセッションを閉じる必要がある
ダイアログの「セッションの管理」ボタンをクリックするか、「ランタイム」メニューをクリックし、「セッションの管理」を選択する
リストにある不要なノートブックを終了する