AIとICTの進歩的探求

AIの進化や革新的なテクノロジーにフォーカスし、わかりやすく解説していきます。

ChatGPTの新機能:コードインタプリンターの仕様とは?(8/29追記・修正)現:AdvancedDataAnalysis(アドバンスドデータアナライズ)

 

コードインタプリンターの活用と仕様

AdvancedDataAnalysis(アドバンスドデータアナライズ)と名称が変わりました!

目次

  1. コードインタプリンターの基本的な仕様
  2. コードインタプリンターで読み込めるファイルの制約
  3. データの永続化と保存可能な容量
  4. データ加工の可能性と利用できる項目
  5. 追記

使い方はこちら

1. コードインタプリンターの基本的な仕様

コードインタプリンターは、ユーザーが提供したコードを実行し、その結果を返すツールです。主な特徴として以下があります。

  • ステートフルな環境: コードインタプリンターはステートフルな環境で動作し、一つの会話セッション中で実行されたコードの変数や結果を維持します。
  • Jupyter Notebookの環境: コードインタプリンターはJupyter Notebookのような環境で動作し、データ分析や探索的プログラミングに適しています。
  • 制限時間: 各コードの実行は最大120秒までとなっています。
  • インターネット接続の制限: セキュリティ上の理由から、コードインタプリンターはインターネット接続を持っていません。
  • データ永続性: '/mnt/data'ディレクトリに保存されたデータは会話セッション間で永続化されます。
  • セキュリティ: コードインタプリンターはユーザーのプライバシーを保護し、安全にコードを実行するための措置を講じています。

2. コードインタプリンターで読み込めるファイルの制約

コードインタプリンターではユーザーが提供したファイルを読み込むことができますが、以下の制約が適用されます。

  • ファイルサイズ: 一度にアップロードできるファイルの最大サイズは500MBまでです。ストレージに保管できるデータは10GB
  • ファイル形式: 特別な制約はありませんが、使用可能なライブラリに制約があります。
  • セキュリティ: ファイルの内容はセキュアに転送・保存され、アクセスは制限されます。
  • データ永続性: アップロードしたファイルは会話セッションが終了すると削除されます。

3. データの永続化と保存可能な容量

データを永続化するには、データを '/mnt/data' ディレクトリに保存する必要があります。このディレクトリに保存されたデータは異なる会話セッション間で永続化されます。保存可能な容量に制限はありませんが、大量のデータの保存はパフォーマンスに影響する可能性があるため注意が必要です。また、データの管理はユーザー自身の責任であり、不要なデータは適時削除することが推奨されます。

4. データ加工の可能性と利用できる項目

コードインタプリンターはPythonとその標準ライブラリ、および一部の人気のあるサードパーティライブラリを使用してデータの加工が可能です。以下のようなデータ加工タスクを実行できます。

  • データクレンジング: データの正規化、欠損値の処理、外れ値の検出などを行うことができます。
  • データ変換: データの形式変換や特定の計算を行うことができます。
  • 統計解析: 統計量の計算や統計的なテストを行うことができます。
  • データ視覚化: グラフやチャートを作成してデータを視覚化することができます。
  • 機械学習: 分類、回帰、クラスタリングなどの機械学習タスクを実行できます。

これらのタスクはPythonの基本的な機能と一部のライブラリを使用して実現できます。具体的には、numpy、pandas、matplotlib、scikit-learnなどのライブラリが利用可能です。仕様については、調査中ですのでまた分かり次第追記したいと思います。

5. 仕様追記

〇Pythonライブラリ一覧

ai-techtalk-navi.com

○ZIP形式であれば複数データを一度に渡せる

○テキストデータを書き出して置いて、再度読み込ませる事でChatGPT側がたまに状態を忘れる事を防げる

○IOS版については、スマホからでもファイルをアップロードできる

○処理のリソースには限界がある様です。GPUをかなり使う様な処理を依頼すると処理能力が足りない旨のアナウンスが表示される

○セッションがタイムアウトされやすい(120秒以上かかるとタイムアウト)

○ネット接続併用不可、外部APIへのリクエスト送信やスクレイピング不可

○前述のデータの扱いだが、一定期間保持後順次削除される様だ(記事内の記載誤り)

○アップロードしたデータに関して、問題があった(フォーマット的に)場合に修正をしてくれる

○音声ファイルについては、文字起こしは不可みたいです

○システムに干渉する様なコマンドを実行させようとすると拒否される

○エラーが事前に予測されるコードを実行させようとすると、エラーが起きる旨を教えてくれる

○依頼内容に到達するまで、様々なアプローチで試行する(人間みたい)

○アップロード可能なデータ容量は、512MBとされているが500MB前後のデータでもエラーが発生したりする。また、データの種類やデータ内の件数も影響があるようで試してみないと何とも言えない

〇プログラミング言語サポート:Python、Bash、R、JavaScript、TypeScript、Shell、SQLに対応

〇Plotlyを使ってグラフ生成させようとするとエラーになる

〇PDF形式は読み込めるが、文字部分のみ取得していて画像は取得されていない様だ(ただ、できなかったときに「あなたならできる」と励ましの言葉をかけると動いてくれる場合も・・・?)

〇顔認識もいけるようです

〇利用回数の制限:あくまでもChatGPT-4なので、3時間あたり25回の回答生成までしか利用できない。この回数に達すると一定時間利用不可になってしまう。

〇攻撃的なコードをアップロードしようとすると、危険を察知して止める

〇画像系の出来る事・出来ない事

〇ライブラリのファイルなどをアップロードすることで外部ライブラリも使用可能