【非プログラマの方に向けて】データについて理解しておくと良い3つのこと:データ種類・型・コンテナ

2020.12.08

この記事は公開されてから1年以上経過しています。情報が古い可能性がありますので、ご注意ください。

CX事業本部の山本です。

今回は、普段プログラミングやソフトウェア開発をしない方に向けて、ソフトウェアの中でも「データ」について知っておくと良いことについて書きたいと思います。

本記事の内容がわかると、システム開発ができたり、また、開発をしないまでも、プログラマ・エンジニアと呼ばれる人たちと話をする上で、何を言っているのかわかりやすくなるかと思います。

大まかなところを理解した方が良いと思うため、細かな点では正確ではないところもありますので、ご了承ください。

はじめに

ソフトウェアとは、かなり簡単に言うと、下図のように「データを受け取り、処理をして、別の形のデータにするもの」のことを言います。今回の記事は、この「データ」についての内容です。

結論

先に、本記事の内容をまとめると、以下の3点がポイントです。

  • データには種類がある
  • データの種類によって処理が異なる
  • データは階層化して入れ子構造のように組み合わせることができる

データには種類があり、それぞれの種類ごとによって、利用できる処理が異なります。そのため、目的に合ったデータの種類を利用する必要があります。基本的には、以下の3種類があり、必要に応じてデータ種類間で変換しながら利用します。

数値

通常通りの数値のことです。通常の足し算・引き算・掛け算・割り算や、大小の比較などをすることができます。また、プログラミング言語(ライブラリ)・システムによっては、三角関数や対数などを利用した計算もできます。

少し細かい話ですが、数値の中には、さらに以下の2種類があります。基本的には2つのデータとも同様に利用できるのですが、整数しか利用できない場合があります(リストなどで使用する場合など、後述)。

  • 整数
  • 小数

文字列

通常通りの文字のことです。主に、文字列同士をくっつけて新しい文字列にしたり、文字列の中から特定のワードを検索したりする際に使用します。

2値

これは少し見慣れないデータだと思います。論理演算と呼ばれる、主に条件分岐のために使う演算で使用します。その名前の通り、True・Falseの2つしかありません。真偽値とも呼ばれます。

例えば、「買い物の合計金額が1000円以上かどうか」といった、判定をした結果のデータです。また、複雑な条件を判定するために、複数の条件を組み合わせることもあります。例えば、「距離が10m~30mの間」を判定するには、「「距離が10m以上」"かつ"「距離が30m以下」」のように2つの条件を判定して組み合わせます。

特殊データ(型)

データを一定の形で組み合わせることで、使いやすくすることがあります。これを型と言います。型はもともと決まっているものに加え、プログラム作成者が自分で新しく決めることができるものもあるので、種類は(ほぼ)無限に存在します。

その中で覚えておくべきデータとして、日付(date・datetime)があります(日付を基本データのように扱うプログラム・サービスもあります)。

  • datetime(日付・時刻)

    日付や時刻を扱うためのデータです。2つの日付間の日数を計算したり、ある日付の4日後の日付を計算する、といった使い方ができます。

複合データ(コンテナ)

上記のデータを階層化することで、まとめて処理できるようにするものです。いくつかありますが、覚えておく良いのは以下の2つです。

  • リスト(配列、アレイとも)

    データをそのまま並べてまとめたものです。並べたデータが数値であれば、それらを合計や平均を計算することができます。また、並べたデータに対して、繰り返し同じ処理をすることもできます。

  • 辞書(ディクト、マップとも)

    データに名前をつけてまとめたものです。まとめた中のデータを取り出す際には、つけた名前を指定します。こうすることで、どのデータを利用しているかわかりやすくなり、また、同じ名前でデータを入れておけば、違う種類のデータでも同じ方法で取り出すことができます。