HOME > IBM SPSS > 機能一覧
IBM SPSS Statistics

一般的な操作

  • ユーザー・インターフェイス言語の切替(日本語⇔英語など)
  • データエディタ内で分割機能を使用することで、横長/縦長のデータセットを素早く容易に理解
  • カスタマイズ可能なツールバー機能を選択
    • プロシージャ、スクリプト、他のソフトウェア製品を割り当て
    • 標準的なツールバーアイコンから選択。あるいは自分自身でアイコンを作成
  • 多次元ピボットテーブル/レポートキューブ
    • 分析に応じて、アイコンを移動して列、行、層を入れ替え
    • アイコンをクリックして層を切り替えること
    • で、サブグループを容易に比較
    • 統計手法/グラフの種類の選択や、結果の解釈を支援するオンライン統計ヘルプ。実際の応用例を含む
  • テキストの属性(フォント、色、太字、斜体等)を変更
  • 表の属性(数値の書式、線種、線幅、列位置合わせ、背景/前景の網掛け、線の表示/非表等を変更
  • 行/列/ラベルの表示/非表示を個々に設定して、要点を強調
  • 各タスク用のヘルプで順を追って説明
    • ケーススタディ:選択した統計の使用法と結果の解釈
    • 統計コーチを使用し、最も適した統計手法やグラフを選択
    • チュートリアルの活用
    • 「ヒント」のリンクをクリックしてチュートリアルを表示し、より詳細なヘルプを表示
    • 「用語のヘルプ」を使用し、統計用語や注意点をポップアップ表示
  • 出力用の書式設定
    • 表をグラフに変換し、より視覚的で説得力のあるコミュニケーションを行う
    • 相関分析の際に、デフォルトの出力表示を使用して、相関係数とその有意水準(Nを含む)を表示
    • 起動の際に新しいウィンドウを開くのか、あるいは既存のウィンドウ内に表示するのを選択
    • ジャーナルファイルに日付と時間を記録し、参照が容易
    • バッチ機能を立ち上げなくても、IBM SPSS Statistics シンタックスファイルアイコンを右クリックすることでコマンドファイルの実行が可能
    • ドロップダウンリストを使用し、別の層に容易にアクセス
    • 全体のページ設定を指定
    • データエディタ内のデフォルト列幅を設定
    • すべてのピボットテーブルの列幅を設定し、テキストの折り返しを定義
    • 小数を表示するのに科学的表記法を使用するかどうかの選択が可能
    • IBM SPSS Collaboration and Deployment Services を使用することで、レポートをインラクティブに扱ったり、組織内の他の人が作成したモデルやコードを使用することが可能に
    • 脚注や注釈の追加
    • 表内のカテゴリを並べ替えて、結果を効果的に表示
    • 行や列内の複数のカテゴリをまとめて、1つの見出しの下に表示
    • 16のテーブルルックの書式の1つを使用することで、結果を素早く、一貫した書式で作成
    • 作成したカスタム書式をテーブルルックとして保存し、自分の書式として使用
    • 表ラベルを回転
    • ピボットテーブル内でテーブルラベルの回転
  • ビューアを使用して結果を構成、表示、移動
    • デフォルトである「追加」(オプションメニュー)を使用することで、ジャーナルファイルに作業内容を記録
    • アウトラインを利用して、出力の場所を素早く理解
    • アウトライン内のアイコンを選択して、これに対応する結果を右側の内容枠内に表示
    • アウトラインでアイコンを移動することで、グラフ、表、その他のオブジェクトを並べ替え
    • アウトラインで項目を選択してこれを展開したり折りたたむことで、選択した結果を表示/非表示
    • 表、グラフ、オブジェクトが1つの内容枠内に表示され、把握やアクセスが容易に
    • 出力の位置合わせ(右/左/中央揃え)
    • ビューア内の内容部分、アウトライン部分のそれぞれ、あるいは両方に対して情報の検索と置換を実行
  • 分析の設定を作成/保存し、反復的な作業や自動処理に使用
  • ダイアログインターフェースやマクロを持つ改善されたバッチ機能を使用して、より容易に定期報告を作成
  • 改ページ機能や出力が強化され、表の分割表示を完全にコントロール
  • 印刷プレビューオプションの選択
  • 必要に応じてコマンドライン入力ウィンドウを使用して、自分自身のコマンドを入力
  • 統計用語の説明をスクリーン上に表示
  • データを使った作業が容易に
    • ダイアログボックスの大きさを変更可能
    • ダイアログボックス内でドラック&ドロップ
  • 出力をMicrosoft Wordにエクスポート
    • 書式を損なわずに、ピボットテーブルをWordの表に変換
    • グラフィックスを静止画像に変換
    • 幅の大きい表の縮小と折り返し
    • シンタックスを使用してレポート生成の自動化
  • Microsoft PowerPointにエクスポート。(Windonsのみ)
    • すべての設定を保持したまま、ピボットテーブルをPowerPointのテーブル表に変換
    • グラフィックを静的な図に変換
    • 幅の大きい表の縮小と折り返し
    • シンタックスを使用してレポート生成の自動化
    • 行と列を追加して既存のワークシートに変更を加える
  • 出力をExcelにエクスポート
    • 複数の表を、Excelワークブックファイル内において同じ/別のシート上に表示
    • IBM SPSS Statisticsピボットトレイに表示されている層のみ、あるいはすべての層をエクスポート
    • 各ピボットトレイの層を、Excelワークブックの同じ/別のシート上に表示
    • シンタックスを使用してレポート生成の自動化
    • 既存のワークブックに新しいワークシートを作成
    • 行と列を追加して既存のワークシートを編集
  • 出力をPDFにエクスポート
    • Web上での表示用にPDFを最適化可能
    • PDFが生成する「ブックマーク(しおり)」を、出力ビューア内のナビゲータアウトラインに対応させるかどうかを指定
    • フォントを文書内に埋め込むかどうかを指定。フォントを埋め込むことによって、フォントが置換されなくなり、文書のテキストを元のフォントで表示することが可能に
    • シンタックスによるレポート生成の自動化
  • シンタックスを使用して新しい出力ファイルを容易に開く/保存/作成
  • ホイールマウスで出力ビューアをスクロール
  • 出力言語の切り替え(日本語/英語等)
  • スクリプトを使用して以下を実行
    • スクリプトの作成、編集と保存
    • カスタマイズしたインターフェイスの構築
    • ツールバーのアイコンやメニューにスクリプトを割り当て
    • 特定のイベントが発生した際に自動的にスクリプトを実行
    • Python 2.5対応。スクリプトをより容易に信頼できるものに
    • IBM SPSS Statisticsをより大きなカスタムアプリケーションに統合(WordやExcel)
  • HOSTコマンドを使用してIBM SPSS Statisticsのオペレーティングシステム機能を活用。このコマンドはアプリケーションがオペレーティングシステムに”エスケープ”させ、IBM SPSS Statisticsセッションと同期して他のプログラムを実行することが可能
  • 複数のプロジェクトの変換を含むことが可能な、共通または主要なプロジェクトディレクトリを作成する際に、シンタックスジョブのブレイクを防止
    • 複数のプロジェクト、シンタックス ファイル、データセットの管理性向上
  • INSERTコマンドを使用してインタラクティブ・シンタックス・ルールを指定
  • コマンド・シンタックス・エディタを使用して簡単にシンタックスを生成
    • オートコンプリーション
    • シンタックスのカラー・コーディング
    • シンタックスのエラー・コーディング
    • 行番号やブレイクポイントの表示枠
    • シンタックスジョブの実行
    • 自動字下げ
  • カスタム・ダイアログ・ビルダーを使用して、既存の手法やユーザー定義した手法用のインターフェイスを作成
  • IBM SPSS SmartReader を使用してIBM SPSS Statisticsを所有していない人と出力結果を共有
  • INSERT コマンドを使用してインタラクティブ・シンタックス・ルールを

 

グラフィック機能

  • カテゴリ型のグラフ
    • 3D棒グラフ:単純、クラスタ、積み上げ
    • 棒:単純、クラスタ、積み上げ、影付き、3-D効果
    • 折れ線:単純、多重、ドロップライン、強調表示
    • 面:単純、積み上げ
    • 円:単純、分割の切り出し、3-D効果
    • ハイロー:単純、クラスタ、ハイロークローズ
    • 差分折れ線
    • 箱ひげ図:単純、クラスタ
    • 範囲棒:単純、クラスタ
    • エラーバー:単純、クラスタ
    • エラーバー:ライン・エリア チャート
    • 2重Y軸とオーバーレイ
  • 散布図
    • 単純、重ね書き、行列、3-D
    • サブグループとケースのラベルを表示
    • 色やマーカーのサイズで分割を設定することによって、大規模なデータセット内のデータの集中を把握
    • 適合線の使用:線型回帰、2次回帰、3次回帰;Lowess(局所的重み付け回帰平滑法)、平滑化、全体あるいはサブグループに対する信頼区間制御、線への垂線の表示
    • 色またはマーカーサイズによるポイントの分割で重複を回避
  • 密度グラフ
    • 人口ピラミッド:分布を左右に対応するように表示して比較。正規曲線の表示/非表示が選択可
    • ドットプロット:積み重ねられた点(ドット)が分布を表現。対称、積み上げ、平面
    • ヒストグラム:正規曲線の表示/非表示を選択可。カスタム分割オプションを選択可能
  • 品質管理図
    • パレート
    • Xバー管理図
    • R管理図
    • S管理図
    • 個別図
    • 移動幅図
    • グラフ強化機能の設定:シューハート規則から外れた点を自動的にフラグ化、規則の解除、グラフの非表示等
    • (新)管理図の副図内での管理ルールチェック
  • 診断/探索プロット
    • ケースプロットと時系列プロット
    • 確率プロット
    • 自己相関/偏自己相関関数プロット
    • 交差相関関数プロット
    • ROC(Receiver-Operating Characteristic)分析
  • 複数用途のグラフ
    • 2次元折れ線グラフ(両方の軸をスケール軸とすることが可能)
    • 多重回答セット用のグラフ
  • カスタムグラフ
    • Graphics Production Language(GPL)はカスタムグラフ作成用の言語で、上級ユーザーであれ、インターフェイスからは作成できないさまざまなグラフやオプションを活用できる
  • グラフボードと統合することでIBM SPSS Statistics Baseから、IBM SPSS Viz Designerで作成されたグラフテンプレートへアクセス
  • 編集オプション
    • カテゴリを自動的に並べ替え。異なる順番(降順または昇順)あるいは異なるソート手法(値、ラベル、要約統計量)によるデータ値ラベルを作成
    • 接続線を図表内の任意の場所にドラッグして追加。字の色をサブグループの色に合わせる
    • 特定の要素を直接グラフ内で編集: 色、テキスト、スタイル
    • 線の種類、太さを選択可
    • 格子線、参照線、凡例、表題、脚注、注の表示
    • Y=X参照線を表示
  • レイアウトオプション
    • パネルグラフ:サブグラフのテーブルを作成。1枚のパネルが1つのレベルや条件に対応し、複数の行や列を表示
    • 3-D効果:回転、奥行きの設定、背面の表示
  • グラフテンプレート
    • グラフのある要素を選択して保存した後、これらの要素をテンプレートを使用して他のグラフに自動的に適用することで、属性をより詳細に設定。以下の属性を作成/編集に適用可能:レイアウト、表題、脚注、注釈、グラフ要素のスタイル、データ要素のスタイル。軸のスケール範囲、軸のスケール設定、適合線と参照線、散布図の点の分割
  • グラフのエクスポート:EMF、WMF、TIF、PCT、PNG、EPS、BMP、JPG
  • SPSS 15.0以前のファイルを開くためのIGRAPH変換機能

 

分析 記述統計 レポート

  • OLAPキューブで以下のことが可能
    • パーセントを使用して、2つの関連する変数間の平均値や合計の変化を素早く推定。たとえば、四半期ごとに売上がどのように上昇しているのかを簡単に理解
    • ケースの要約を作成
    • レポートの要約を作成
    • さまざまな書式オプションを使用して、プレゼンテーションに使用できる質の高いレポートを生成
    • 分割グループに関して、ケースのリストや、統計量を含むケースの要約レポートを生成度数分布表

コードブック

  • 結果に含まれている変数情報の管理:ポジション、ラベル、タイプ、フォーマット、尺度レベル、値ラベル、欠損、カスタム属性、予約属性
  • 結果のファイル情報の順序の管理:名前、場所、ケース数、ファイルラベル、ユーザー定義のカスタム属性、データファイルドキュメントテキスト、重みステータス、予約属性
  • 要約統計の管理:各カテゴリのケース数、各カテゴリのケースのパーセンテージ、平均、標準偏差、四分位
  • 表示順序の管理:ファイル順、変数名のアルファベット順、コマンドに変数や複数回答セットがリストされている順、尺度レベル、ユーザー定義のカスタム属性の名前と値

度数分布表

  • 度数分布表:度数、パーセント、有効パーセント、累積パーセント
  • 出力を分析ごとあるいは表ごとに並べるオプション
  • 不要な線をテキストから除外した、コンパクトな表を出力
  • 中心傾向:平均値、中央値、最頻値、合計
  • 散らばり:最大、最小、範囲、標準偏差、標準誤差、分散
  • 分布:尖度、尖度の標準誤差、歪度、歪度の標準誤差
  • パーセンタイル値:パーセントタイル(実際のデータ/グループ化されたデータに基づく)、四分位、等サイズのグループ
  • 書式:要約/標準、度数によるカテゴリのソート、表のインデックスを生成
  • グラフ:棒グラフ、ヒストグラム、円グラフ

記述統計量

  • 中心傾向:平均値、合計
  • 散らばり:最大、最小、範囲、標準偏差、標準誤差、分散
  • 分布:尖度、歪度
  • Z得点:計算後、新しい変数として保存
  • 表示順:平均値や変数名の昇順/降順

探索的データ分析

  • 平均値の信頼区間
  • 記述統計量:4分位範囲、尖度、尖度の標準誤差、中央値、平均値、最大、最小、範囲、歪度、歪度の標準誤差、標準偏差、標準誤差、分散、5パーセントトリム平均値、パーセント
  • M-推定量:Andrewのウェイブ、HampelのM-推定量、HuberのM-推定量、Tukeyのバイウェイト
  • 極値や外れ値の特定
  • グループ化された度数分布表:ビン中心、度数、パーセント、有効、累積パーセント
  • プロット:複数のグラフで共通した目盛り、あるいはグラフごとにデータ値に基づいた目盛りでプロットを作成
    • 箱ひげ図:従属変数と因子レベルの両方
    • 記述統計量:ヒストグラムと幹葉図
    • 正規性:Kolmogorov-SmirnovやShapiro-Wilk統計量による正規確率プロットならびに傾向化除去正規確率プロット
    • Leveneの検定による水準と広がりの図:べき乗推定、変換、変換なし
    • 重みが指定されていない場合に、EXAMINEに含まれるShapiro-Wilkの正規性の検定で5000ケースを処理

クロス集計表

  • Cochran-Mantel-Haenszel統計量で、カテゴリデータ内の3次の関係性を扱うことにより、2次元のクロス集計表の限界を超える
  • 度数:観測度数と期待頻度
  • パーセント:列、行、合計
  • 長い文字型変数
  • 残差:元の残差、標準化、調整済み標準化
  • 周辺:観測度数と合計パーセント
  • 独立性の検定:Pearsonのカイ2乗とYatesの修正カイ2乗、尤度比カイ2乗
  • 線型連関の検定:Mantel-Haenszelカイ2乗
  • 線型連関の測度:Pearsonのr
  • 名義データの測度:分割係数、CramerのV、ファイ、GoodmanとKruskalのラムダ(対称/非対称)ならびにタウ(列あるいは行従属)、不確定性係数(非対称/対称)
  • 順序データの測度:GoodmanとKruskalのGamma、KendallのTau-bならびにTau-c、SomersのD(非対称/対称)、Spearmanの相関
  • 名義と間隔:イータ
  • 一致の測度:Cohenのカッパ
  • 相対リスク推定によるケースの制御とコーホート調査
  • 表を昇順/降順で表示
  • 度数をファイルに書き込む
  • McNemarの検定
  • 整数/非整数の重みが使用可

比率統計

  • データの理解:
    • 散らばり係数
    • 変動係数
    • 価格関連格差(PRD)
    • 平均絶対偏差

平均の比較 平均

  • 調和平均や幾何平均を使用して、より優れたモデルを作成
  • セル:度数、平均値、標準偏差、合計、分散
  • 全次元の合計
  • 分析の測度:イータ、イータの2乗
  • 線型性の検定:R、R2乗
  • 結果の表示:レポート、クロス集計表、ツリー形式
  • 全サンプルに関する統計量を計算

t検定

  • 1サンプルのt検定:サンプルの平均値を、指定した参照平均値と比較
  • 独立したサンプルのt検定:Leveneの等分散性の検定を使用して、2つのサンプルの平均値をプールされた/別々の分散推定と比較
  • 対応のある(ペアごとの)サンプルのt検定:ペア間の相関、平均値間の差、ペア間に差がないことを検定、ゼロ相関の両側確率検定
  • 統計:信頼区間、度数、自由度、平均値、両側確率、標準偏差、標準誤差、t統計量

一元配置分散分析

  • 対比:線型、2次、3次、それ以上の次数、またはユーザー定義
  • 範囲検定:Duncan、最小有意差(LSD)、Bonferroni、Student-Newman-Keuls、Scheffe、Tukeyの交互検定、TukeyのHSD
  • その後の検定:Student-Newman-Keuls、TukeyのHSD、Tukeyのb、スチューデント化された範囲検定に基づくDuncanの多重比較プロシージャ、Scheffeの多重比較t検定、Dunnettの両  側t検定、Dunnettの片側t検定、Bonferroniのt検定、最小有意差t検定、Sidakのt検定、HochbergのGT2、スチューデント化された最大法検定に基づいたGabrielのペアごとの比較検定、F検定に基づくRyan-Einot-Gabriel-Welschの多重ステップダウンプロシージャ、スチューデント化された範囲検定に基づくRyan-Einot-Gabriel-Welschの多重ステップダウンプロシージャ、TamhaneのT2、TamhaneのT3、スチューデント化された範囲検定に基づくGamesとHowellのペアごとの比較検定、DunnettのC、Waller-Duncanのt検定
  • 分散分析統計量:グループ間/グループ内平方和、自由度、平方平均、F比、Fの確率
  • 固定効果の測度:標準偏差、標準誤差、95%信頼区間
  • 変量効果の測度:分散成分推定、標準誤差、95%信頼区間
  • グループ記述統計:最大、平均値、最小、ケースの個数、標準偏差、標準誤差、95%信頼区間
  • 等分散性検定:Leveneの検定
  • 行列の読み込み/書き出し
  • 平均値の同等性:分散やサンプルサイズがグループごとに異なる場合に、正確な結果を得る:
    • Brown-Forsythe検定
    • -Welch検定

分散分析モデル- 単純な多因子

  • 交互作用の最大次数の制限なく、カスタムモデルを作成
  • 因子レベルの範囲を指定する必要がないので、より高速
  • 4種類の平方和を使用して、適切なモデルを選択
  • 空白セルを適切に扱うことで、確実性を高める
  • 不適合度検定で最適なモデルを選択
  • 2種類の計画から選択:釣り合い(balanced)、不釣合い(unbalanced)
  • 共分散分析において共変量を10個まで使用可:実験的、階層的、回帰
  • 共変量の設定:主効果の前/同時/後
  • 交互作用の設定:なし、2次、3次、4次、5次
  • 以下の統計から選択:分散分析、平均値、度数分布表、多重分類分析、非標準化回帰係数、n次元のセル平均値
  • 独立変数を10個まで選択可能
  • MCA(多重分類分析)表の平均値から、予測値と偏差を作成

相関 2変量

  • Pearsonのr、KendallのTau-b、Spearman
  • 片側/両側検定
  • 平均値、非欠損ケースの個数、標準誤差
  • 交差積和と共分散
  • 係数を行列としてあるいは連続的に表示

偏相関

  • 片側/両側検定
  • 平均値、非欠損ケースの個数、標準偏差
  • ゼロ次相関
  • 制御変数を100個まで使用可
  • 最大で5次まで
  • 相関を行列としてあるいは連続的に、下三角あるいは矩形相関行列に表示

距離

 
  • 手法:変数減少法、強制投入、強制除去、変数増加法、前方ステップワイズ選択、R2乗の変化量/有意度検定
  • 式の統計:赤池情報基準、Ameniyaの予測基準、分散分析表(F、平方平均、Fの確率、回帰、平方和の残差)、R2乗の変化量、ステップのF、MallowのCp、多重R、Fの確率、R2乗、調整済みR2乗、Schwarz Bayesian基準、推定の標準誤差、掃出し行列、分散共分散行列
  • 記述統計量:相関列、分散共分散行列、平均値の交差積和、平均値、相関係数の計算に使用されたケースの個数、相関係数の片側確率、標準偏差、分散
  • 独立変数の統計量:回帰係数(B、係数の標準誤差、標準化回帰係数、標準化回帰係数の近似標準誤差、t)、許容度、ゼロ次、部分相関、偏相関、非標準化回帰係数の95%信頼区間
  • 式に含まれていない変数:Betaあるいは最小許容度
  • Durbin-Watson
  • 共線性の診断:条件指標、固有値、変動インフレーション因子、分散の比率、許容度
  • プロット:ケースごと、ヒストグラム、正規確率、傾向化除去正規確率、偏残差、外れ値、散布図
  • 変数の作成と保存:
    • 間隔変数の予測:平均値と個々の値
    • 予測値:非標準化、標準化、調整済み、平均値の標準誤差
    • 距離:Cookの距離、Mahalanobisの距離、てこ比の値
    • 残差:非標準化、標準化、スチューデント化された、除去された、スチューデント化されて除去された
    • 影響力の統計:dfbeta、標準化dfbeta、dffit、標準化dffit、共分散比
  • オプション制御:F値(投入)、F値(除去)、F確率(投入)、F確率(除去)、定数を抑制、重み付き最小2乗モデルの回帰式の重み、信頼区間、最大ステップの最大回数、変数の欠損値を平均値で置き換え、許容度
  • 回帰係数をユーザーが定義した順序で表示
  • OUTFILEコマンドを使用して、システムファイルにパラメータ推定、その共分散、相関行列を含む
  • 解を新しいケースに適用、あるいは将来の分析で使用
  • モデルをXMLでエクスポートすることで、組織内の意思決定をさらに改善

順序回帰-PLUM

  • 順序型の結果を予測
    • 7つのオプション:推定に使用される反復アルゴリズムの設定、特異性を調べる数値型の許容度を指定、出力のカスタム化
    • 5つのリンク関数によるモデルの指定:コーチット、補ログ-ログ、ロジット、負ログ-ログ、プロビット
    • Locationサブコマンドによる位置モデルの指定:切片、主効果、交互作用、入れ子型の効果、マルチレベルの入れ子の効果、交互作用内の入れ子、入れ子効果間の交互作用、共変量
    • 出力:セル情報、パラメータ推定の漸近相関行列、適合度統計量、反復履歴、対数尤度関数のカーネル、平行線の検定、パラメータ統計量、モデルの要約
    • ケースごとの推定後の統計量を使用中のファイルに保存:因子/共変量パターンを応答カテゴリに分類する際の推定確率、因子/共変量パターンの最大推定確率を含む応答カテゴリ
    • TESTサブコマンドを使用して、帰無仮説をパラメータの線型結合として直接指定することで、仮説検定をカスタム化(シンタックスのみ)

曲線推定

  • 11種類の曲線から選択
    • 回帰の要約を表示:曲線の種類、R2乗係数、自由度、全体的なF検定と有意水準、回帰係数
    • トレンド回帰モデル:線型、対数、逆数、2次、3次、複合、べき乗、S、成長、指数、ロジスティック

ノンパラメトリック検定

  • (新)カイ2乗:期待範囲(データから/ユーザー指定)と期待度数(すべてのカテゴリが同じ/ユーザー指定)を指定
  • (新)2項:2分割(データから/分割点)を定義、検定比率を指定
  • (新)ラン:分割点(中央値、最頻値、平均値、ユーザー指定)を指定
  • (新)1サンプル:Kolmogorov-Smirnov、一様、正規、Poisson
  • (新)2個の独立サンプル:Mann-WhitneyのU、Kolmogorov-SmirnovのZ、Mosesの外れ値反応、Wald-Wolfowitz のラン
  • (新)K個の独立サンプル:Kruskal-WallisのH、中央値
  • (新)2個の対応サンプル:Wilcoxon、符号、McNemar
  • (新)K個の対応サンプル:Friedman、KendallのW、CochranのQ
  • (新)記述統計量:最大、平均値、最小、ケースの個数、標準偏差

多重回答

  • クロス集計表:セル度数、ケースや回答に関するセルパーセント、列/行/2次元表パーセント
  • 度数分布表:度数、ケース/回答のパーセント
  • 多重2分グループならびに多重回答グループの両方を扱うことが可能

データの分解(縮約) 因子分析*

  • 分析に使用したケースの個数と変数ラベルを表示可能
  • 入力:相関行列、因子、負荷行列、共分散行列、生データのケースファイル
  • 相関行列や因子行列の出力
  • 7種類の抽出手法(相関行列/生データファイルに分析を実行する場合):主成分分析、主因子、アルファ因子法、イメージ因子法、最尤法、重み付けのない最小2乗、一般化した最小2乗
  • 回転手法:バリマックス、エカマックス、クォーティマックス、プロマックス、オブリミン
  • 表示:初期の/抽出後の共通性、固有値、パーセント分散、回転のない因子負荷、回転後の因子パターン行列、因子変換行列、因子構造、相関行列(斜交回転のみ)
  • 共分散行列を3種類の抽出手法で分析:主成分、主因子、イメージ
  • 因子得点:回帰、Bartlett、Anderson-Rubin
  • 因子得点をアクティブな変数として保存
  • 統計:1変量の相関行列、相関行列の行列式/逆数、反イメージ相関と共分散行列、Kaiser-Meyer-Olkinのサンプル適正測定、Bartlettの球面性の検定、因子パターン行列、抽出後の共通性、固有値ならびに固有値のパーセント分散、再生相関ならびに残差相関、因子得点係数行列
  • プロット:スクリープロットと因子空間内の変数のプロット
  • 行列の入力/出力
  • 負荷量平方和による回転後の計算
  • 解を新しいケースに適用。あるいはサブコマンドを使用して、将来の分析で使用
  • 因子得点係数行列をエクスポートし、新しいデータをスコア化(シンタックスのみ)

分類 TwoStepクラスタ分析

  • 近さ(類似度)の基準に基づいて、観測値をクラスタにグループ分けします。このプロシージャでは、階層的凝集型クラスタ化プロシージャ(中心が遠く離れている複数のクラスタに、個々のケースを次々に含めていく手法)を使用します。このアルゴリズムは、大量のケースをクラスタ化するためのものです。まずクラスタ中心を発見するためにデータを流し、その後クラスタメンバーシップを割り当てる目的でもう一度データを流し、その後クラスタメンバーシップを割り当てる目的でもう一度データを流します。観測値のクラスタ化には、CFツリー(クラスタ中心を含む)というデータ構造を構築します。CFツリーは、最初の段階のクラスタ化の過程で成長し、ある値が特定の葉ノードのクラスタ中心に近ければ、そのノードにこの値を加えます。
    • カテゴリデータと連続データが使用可
    • 距離測度:ユークリッド距離、対数尤度距離
    • Criteriaコマンドでアルゴリズムを設定:
    • CFツリーを成長させる初期の閾値を設定
    • 葉ノードに含まれる子ノードの最大個数を設定
    • CFツリーの最大レベル数を設定
    • HANDLENOISE(ノイズ処理)サブコマンドを使用し、クラスタ化の過程で外れ値を特別な方法で扱う。デフォルトのノイズパーセントの値はゼロ(=ノイズ処理なし)。値の範囲は、0~100
    • INFILEサブコマンドを使用した、アルゴリズムによるクラスタモデル(OUTFILEサブコマンドでXMLファイルとして保存されたCFツリー)の更新
    • MEMALLOCATEサブコマンドで、クラスタアルゴリズムが使用できる最大メモリ量(単位メガバイト)を設定
    • 欠損データ:ユーザー欠損とシステム欠損値の両方を除外、あるいはユーザー欠損値を有効値として扱う
    • 連続変数を標準化する、あるいは元の尺度のままにしておくオプション
    • クラスタの個数の指定、クラスタの最大個数の指定、クラスタの個数を自動的に選択
    • クラスタの個数を決定するアルゴリズム:Bayesian情報基準(BIC)あるいは 赤池情報量基準(AIC)
    • 指定されたファイルに出力をXMLとして書き出す
    • 最終モデル出力を保存。あるいは、後でデータを追加してモデルを更新するオプションを使用
    • プロット:
      • 棒グラフ:各クラスタの度数を表す
      • 円グラフ:各クラスタ内に観測値のパーセントと度数を表示
      • 各クラスタ内の個々の変数の重要度:出力は、各変数の重要度のランクに応じてソート
    • プロットオプション:
      • 対比(クラスタごと/変数ごと)
      • 変数の重要度の測度(パラメトリック/ノンパラメトリック)
      • 重要度を考慮する際に有意水準を指定
    • 出力オプション:
      • 情報基準(AIC/BIC):異なるクラスのクラスタに各クラスタ内の変数を記述する2種類の表:1つめの表には、連続変数の平均値と標準偏差を表示。もう1つの表には、カテゴリ変数の度数を表示。すべての値はクラスタによって分割。
      • クラスタと、各クラスタ内の観測値の度数のリスト
      • 各ケースのクラスタ番号を使用中のデータファイルに保存。

階層クラスタ分析

  • 6種類の連結手法の1つでクラスタを決定:単一連結(最近隣法)、グループ間平均連結法、重心法(グループ内平均連結法)、完全連結(最遠隣法)、メディアン法、Ward法
  • 近接と同様の、類似度/非類似度のセットを表示
  • クラスタメンバーシップ(所属)を新しい変数として保存
  • 距離行列を保存し、他のプロシージャで使用
  • 表示:クラスタ凝集経過工程、クラスタメンバーシップ、距離行列
  • 拡張性を改善するのに、変数行列の近接を使用
  • 次のプロットより選択:クラスタ解の水平/垂直つららプロット、デンドログラム
  • 表やプロットのケース識別子を指定
  • 行列の入力/出力

大規模ファイルのクラスタ分析

  • 平方ユークリッド距離
  • 中心の選択:大きく離れたケース、最初のK個のケース、直接指定
  • クラスタメンバーシップを変数として保存
  • クラスタ中心を更新する手法は2種類
  • K-Meansクラスタ化アルゴリズム

最近隣分析

  • 予測(結果の指定)または分類(結果の指定なし)するために使用
  • 関心のある特定のケースに印をつける
  • 共変量の再スケール
  • アクティブなデータセットをトレーニングとホールドアウトサンプルに分割する3種類の方法を使用:アクティブデータセットの相対的なケース数を指定し、トレーニングサンプルにランダムに割り当て。アクティブデータセットの相対的なケース数を指定し、ホールドアウトサンプルにランダムに割り当て。アクティブデータセットの各ケースをトレーニングまたはホールドアウトサンプルに割り当てをする変数を指定
  • 最近隣”モデル”を指定
  • -距離行列を指定し、ケースの類似度を測定
  • -最近隣の数字を自動選択するかどうか
  • -機能(予測変数)を自動選択するかどうか
  • KNN手法の計算とリソース設定を指定。特に:
  • -どのように自動機能選択が機能の数を選択するべきか
  • -尺度応答変数の予測値を算出する関数
  • -距離を算出する際に正規化の重要性によって機能を重み付けするかどうか
  • v-fold相互検証を実行する設定を指定し、最も妥当な近隣値を決定
  • カテゴリ変数のユーザ欠損値が有効な値として扱うかを制御
  • モデル関連の結果の表示(表やグラフを含む)のオプションを制御
  • アクティブデータセットに任意のテンポラリ変数の書き込み
  • 最近隣モデルを含むXML形式のファイルを保存。また、重要ケースからの距離を含むIBM SPSS Statistics形式のデータファイルも保存

判別分析

  • 変数の選択手法:直接入力、Wilksのラムダによる最小化、Mahalanobisの距離、最小F比、すべてのペアに関する説明されない分散の合計を最小化、RaoのVの最大増加
  • 統計:
  • -要約:固有値、分散のパーセント/累積パーセント、正準相関、Wilksのラムダ、カイ2乗検定
  • -ステップワイズ:Wilksのラムダ、等価F、各ステップのFの自由度と有意確率、F値(除去)、許容度、最小許容度、F値(投入)、式に含まれていない各変数の統計量
  • -最終:標準化正準判別関数係数、判別関数の構造行列、グループ平均で評価された関数
  • -オプション:平均値、標準偏差、1変量のF比、グループ内共分散/相関行列、ペアごとのF比の行列、BoxのM検定、グループ/全体の共分散行列、非標準化正準判別関数、分類結果の表、分類関数係数
  • 係数(パターン)と構造行列の回転
  • 出力:ステップごと、要約
  • 分類過程:事前確率、等確率、ケースの割合、ユーザー指定
  • プロット:すべてのグループ、ケース、領域マップ、グループ別
  • ケースごとの結果をシステムファイルに保存し、将来の分析で使用
  • 行列ファイルの読み込み/書き込み(以下の統計量を含む):度数、平均値、標準偏差、Pearsonの相関係数
  • 解を新しいケースに適用。あるいは将来の分析で使用
  • ジャックナイフ法による誤分類率の推定
  • モデルをXMLでエクスポートすることで、組織内の意思決定をさらに改善

尺度法

  • RELIABILITYコマンドシンタックスによりデータを減らし、測定を改善
  • ALSCAL多次元尺度法を使用して類似度データ内の隠された構造を発見

行列操作

  • マトリクス代数のコンパクトな言語で、自分で統計ルーチンを記述

データ管理

  • 連続変数のカテゴリ化で連続型データを分析用に準備。
    • データパスで作成されたヒストグラムを利用して、分割点を適切に指定
    • 分割点に基づいて自動的に値ラベルを作成
    • バンドを他の変数にコピー
  • 出力管理システムを使用して自分でカスタムプログラムを作成。IBM SPSS Statisticsプロシージャからの出力をデータ(IBM SPSS Statisticsデータファイル、XML、HTML)に変換し、ブートストラップ、ジャックナイフ法とLeaving One Out法、モンテカルロシミュレーションのようなプログラムを作成
  • IBM SPSS Statisticsでカスタムプログラムを作成。IBM SPSS Statisticsシンタックスをほとんど知らなくでも、出力管理システムコントロールパネルから作成可
  • 重複ケースの特定ツールを使用して、簡単にデータを整理
  • Data File Commentsコマンドを使用して、注釈を追加しデータファイルの内容を理解・管理する
  • データセットを読み取り専用にすることで、誤ってデータを破壊しないようにする
  • 変数プロパティの定義ツールを使用して、すべての値ラベルを簡単に設定し、すぐにデータを分析できるようにする
    • データ辞書の情報(値ラベルや変数の型)を設定
    • データパスによって値のリストならびにそれらの値の度数が初めて表示可能になり、これで適切にラベルを付加
    • データと値ラベルを入れ子のダイアログを使用することなく、直接グリッドに入力できるので時間の短縮
  • データプロパティのコピーツールを使用することで、ある変数から他の変数に(あるいはあるデータセットから他のデータセットに)簡単に辞書情報をコピーして作業を保存
    • テンプレート機能を使用して、変数間/データセット間で辞書情報(変数や値ラベル)をコピー
    • 辞書の複製手法を装備
  • より多くのデータをより効率的に分析
    • ファイルの大きさの心配は実質的に不要(特にオプションのIBM SPSS Statistics Serverと一緒に使用した場合)
  • 複数のダイアログボックスを使用するのではなく、直接グリッドにデータや値ラベルを入力することで時間を節約
  • 共通する変数属性を複数の変数に同時に割り当て
  • 容易に行や列を選択し、情報を貼り付け
  • 容易に変数の順番を変更
  • 重要な(複数の)列を固定することで、データの検討が容易に
  • データエディタ*でデータを直接ソートすることで時間を節約
  • 新しいセッションごとに列幅が調整し直されないように設定
  • キーボードオプションをカスタム化することで高速化
  • 1人の被験者ごとに複数のケースがあるデータファイルを再構成し、1人の被験者に間するすべてのデータを1つのレコードに(データファイルを1変量形式から多変量形式に再構成)
  • 1人の被験者ごとに1つのケースがあるデータファイルのデータを、複数のケースに分ける(データファイルを多変量形式から1変量形式に再構成)
  • データファイルを保存する時に、使い易いGUIで変数を保持
  • リストボックス内の変数ラベルに基づいて変数をソートすることで、自分の組織における方法論に準じて変数を特定/選択
  • ダイアログボックスで変数ラベルを表示;最大半角256文字
  • データエディタで、変数ラベルをポップアップ表示
  • SQLを保存し、後で使用
  • 入力用プロンプトのあるクエリを作成
  • 「where」条件式を使用して、より簡単にデータを選択
  • ASCIIテキストファイルにおいて、1つの文字あるいは複数の文字を区切り文字として設定
  • 新しいユーザー指定の属性を使って、変数に関する辞書情報を自分で作成。たとえば生成された変数がどのように変換されたのかを記述するカスタム属性を作成
  • 変数グループを使用することで、極端に横長のファイルの表示をカスタム化。読み込まれたファイル全体を保持し、分析に使用できるようにしたまま、変数ビューウインドウならびにデータビューウインドウ内に表示される変数を、即座にサブセットに縮小可能。
  • IBM SPSS Statistics ODBCドライバを使用して、Excel等の他のアプリケーションからIBM SPSS Statisticsデータファイルを書き込み
  • 使用する変数やケースの個数に実質上制限なし
  • 変数のサブセットを指定し、これで作業を行う
  • スプレッドシート形式のデータエディタ内で、データを入力、編集、表示
  • 日付と時刻ウィザードを使用して、日付や時間を容易に処理
    • 日付/時刻変数を含む文字列から日付/時刻変数を作成
    • 日付単位(月や年)を含む変数から日付/時刻変数を作成
    • 日付/時刻変数から、個々の日付/時刻単位を算出
    • 日付や時刻を計算
  • 日付/時刻を四捨五入することも可(切り捨てではなく)
  • 時刻データに小数点を追加することも可
  • データエディタのセル内に値/値ラベルを表示
  • ダイアログボックス内でマウスを右クリックすることで、変数情報に直接アクセス
  • 変数名の変更と並べ替え
  • ケースの並べ替え
  • さまざまなデータ書式から選択:数値、カンマ、ドット、科学的表記法、日付、ドル、カスタムの通貨フォーマット、文字型
  • 通貨を表記する際に、ピリオドあるいはカンマを選択可能
  • システム欠損を選択、あるいは各変数ごとに最大3つのユーザー定義欠損値を設定
  • 最大半角120文字までの値ラベルを作成(SPSS13以前のバージョンの2倍)
  • 最大半角256文字までの変数ラベルを作成
  • 変数やケースを挿入/削除
  • 選択された変数における値の検索
  • 使用中のファイルの切り替え
  • データセットのクローン(複製)を作成
  • 拡張された変数プロパティのコマンドを使用することで、個々のユーザーごとにプロパティをカスタム化することが可能
  • 要約関数のセットを使用してデータを集計
    • 集計された値をアクティブファイルに直接保存
    • 文字列によってソース変数用に集計(インターフェース内で)
    • 長い文字列をブレーク変数として使用可(たとえば、性別がブレーク変数の場合、男性と女性が別個に集計)
    • 文字列を集計された変数として使用可
  • ファイルを分割し、サブグループを分析/操作
  • ケースを永続的/一時的に選択
  • 最初のnケースを処理
  • 分析用にケースを無作為抽出
  • 分析用にケースのサブセットを選択
  • 選択された変数の値でケースに重み付け
  • 乱数シードの指定
  • データの順序付け
  • 隣接する観測値を使用して、平滑化、平均化、高速フーリエ変換とその逆数
  • 長い変数名(最大64バイト)を使用して、より正確にデータを記述
    • IBM SPSS 12.0以降扱えるようになった、長い変数名を含むデータベースやスプレッドシートのデータをより容易に処理
  • 長いテキスト文字列(最大32,767バイト)を含むデータを扱っている際に、これが切れたり失われたりしないようにできます。特に自由回答、長いテキスト文字列を使用可能なほかのソフトウェアからのデータ、その他の形式の長いテキスト文字列を使用する際に便利です。
  • データエディタを使用した情報の検索と置換
  • 値ラベルや変数ラベル、テキスト文字列へのスペルチェックで時間を節約
  • データエディタの変数ビュー内で辞書情報を容易にチェック。特定の属性だけを表示させるように設定したり、変数名、型、書式等でのソートが可能
  • データエディタのデータビュー内で簡単に移動。変数を直接指定
  • 欠損値や値ラベルに好きなだけ長い文字列を追加可能
  • シンタックスを使用して文字列の長さや変数の型を変更

ファイル管理

  • 多言語データを使用している際に、Unicodeを使用。これによって言語に固有のエンコーディングによってデータにばらつきが出ることを避けられます。データをUnicodeファイルあるいはコードページファイルファイル(旧バージョンのSPSS Statisticsとの互換性のため)として保存
  • SQLデータベースのコンバージョンフリー/コピーフリーのデータアクセスで、データの処理量を最小化。データをIBM SPSS Statistics形式に変更する必要がなく時間を節約(特にオプションのIBM SPSS Statistics Serverと一緒に使用した場合)
  • パーマネントなデフォルトの起動フォルダを設定
  • データベースウィザードを使用してIBM SPSS Statisticsからデータベースに容易に書き込み。たとえば、以下のことが可能。
    • 新しいテーブルを作成し、これを自分のデータベースにエクスポート
    • 既存のテーブルに新しい行を追加
    • 既存のテーブルに新しい列を追加
    • テーブルの既存の列にデータをエクスポート
  • Excelからのデータ(複合的な文書を含む)のインポートには、データベースウィザードは不要
    • データ型が混在している列も、データを損なわずに読み込み
    • データ型が混在している列を文字型変数として自動的に読み込み、すべての値を有効な文字型変数として読み込み
  • 1回のIBM SPSS Statisticsセッションにおいて複数のデータセットを開くこ、または、ユーザー・インターフェイス上のデータセット数を制限が可能
  • IBM SPSS Data Collection 製品 (IBM SPSS Data Collection Interviewer Web など) や、Quanvert等の伝統的なマーケットリサーチ製品から直接データのインポートが可能
  • IBM SPSS StatisticsのデータをIBM SPSS Data Collection 製品にエクスポート
  • ODBCを使わなくてもOLE DBデータソースからのインポートが可能
  • StataRファイルの読み込み/書き込み
  • 1台のデスクトップ上で複数のセッションを実行できるので作業がより効率化。たとえばライセンスがあれば、長い時間がかかるジョブを実行中に、IBM SPSS Statisticsを他のセッションに使用可能
  • Excelのものと同様のテキストウィザードを使用して、ASCIIデータを容易に読み込み/定義
    • テキスト識別修飾子を使用し、データの読み込みをより容易に
  • 検索/置換機能が強化され、シンタックスファイルの精度と反復性が向上
  • データベースウィザードを使用して、データベーステーブルを読み込む
    • ドラッグ&ドロップによる結合
  • 表やテキストをASCII出力としてエクスポート
  • 表をHTML形式に、またグラフをJPG形式として保存し、IBM SPSS Statisticsの結果をインターネット/イントラネット上に発行
  • IBM SPSS Statisticsのヘルプメニューから、IBM SPSS Developer Central Webサイトに素早くアクセス
  • Excel 2007ファイルの読み込み/書き出し
  • Excel、Lotus 1-2-3®、dBASER® へ/からのファイルの変換
  • 固定書式、自由書式、タブ区切りのASCIIファイルのデータの読み込み/書き込み
  • 固定書式またはタブ区切りのASCIIファイルにデータを書き込み
  • 複雑な構造のファイルの読み込み:階層的ファイル、混合したレコード型、反復データ、非標準的ファイル構造
  • SPSS/PC+TM システムファイルの読み込みと書き込み
  • ファイルの結合
  • 他の IBM SPSS Statistics データファイルのデータ定義を表示、あるいは使用中のファイルに適用
  • トランザクションファイルを使用して、マスターファイルを更新
  • データ行列の読み込み/書き出し
  • 将来の分析用に中間的なさまざまな結果を保存
  • SASR ファイルの最新バージョンを読み込み
  • データファイルをSASにエクスポート
  • データファイルを最新バージョンのExcelにエクスポート
  • IBM SPSS Statisticsデータファイルをカンマ区切り(CSV)テキストファイルとして保存
  • ”ファイル使用中”メッセージが、複数の人が同時に一つのIBM SPSS Statisticsファイルに書き込むことによるデータのエラーを低減

変換

  • 以下の関数を使用して新しい変数を計算:算術、ケース選択、日付/時間、論理、欠損値、乱数、統計、文字型
  • 前または後のケースの既存変数の値を含む新しい変数を作成
  • すべての変数におけるある値の出現度数
  • 文字列や数値のコード化
  • Autorecodeコマンドを使用して、文字型変数を数値型変数に自動的に変換。
    • 値の再割り当てテンプレートを使用して、既存の割り当て方法を適用
    • 複数の変数に対して同時に値の再割り当てを行う
    • 空白文字列を「ユーザー欠損」と定義して値の再割り当てを行う
  • DO IF、ELSE IF、ELSE、END IF構造を使用して条件変換を作成
  • do repeat-end repeat、loop-end loop、vector等のプログラミング構造を使用
  • 変換を永続的/一時的なものに設定
  • 変換をバッチ機能で即座に実行、あるいは必要に応じて実行
  • 検索/置換関数を使って、データ内のテキスト文字列を容易に検索・置換
  • 累積分布関数、逆数分布関数、乱数生成関数を使用:ベータ、Cauchy、カイ2乗、指数、F、ガンマ、Laplace、ロジスティック、対数正規、正規、パレート、スチューデントのt、一様分布、Weibull
    • 相関rの標準2変量正規分布、半正規、逆ガウス、スチューデント化された範囲、スチューデント化された最大法
  • 離散分布関数に累積分布と乱数生成を使用:Bernoulli、二項、幾何、超幾何分布、負の二項、Poisson
  • 非心分布に累積分布を使用:非心Beta、非心カイ2乗、非心F、非心T
  • 密度/確率関数の使用:
    • -連続分布:ベータ、相関Rの標準2変量正規、Cauchy、カイ2乗、指数、F、ガンマ、半正規ランダム、逆ガウス、Laplace、ロジスティック、対数正規、正規、パレート、スチューデントのt、一様分布、Weibull
    • -離散分布:Bernoulli、二項、幾何、超幾何、負の二項、Poisson
  • 非心密度/確率関数を使用:非心Beta、非心カイ2乗、非心F分布、非心t分布
  • 両側確率を選択:カイ2乗、F
  • 補助関数を使用:完全ガンマ関数の対数

IBM SPSS