グループ変数の基礎

カテゴリー: CDISCラボ

SDTMにはいくつかの「とりまとめ用」の変数が存在する。これらの変数は地味で、その用途が理解されていない場合もある。ここで整理しよう。

.
グループ変数の概要はSDTM IGの4.1.2.6.にまとめられている。その中でも、直観的なイメージを与えてくれるのが、下の図だ。この図から、いくつかの重要な知見を得られる。

20140913zz.png

--CAT変数を症例をまたいで利用できる
--CAT変数はグルーピング変数の中でも最上位にいる。この変数の値が同じであれば、症例を超えて同じ意味を有する。例を挙げよう。MHCAT=PRIMARY DIAGNOSISというレコードがあれば、どの症例のデータであっても、それは主要な疾患である。

--SCAT変数は--CAT変数の補佐
これは簡単に類推できる。--SCAT変数のラベルが「Subcategory」なので、誰でも思いつくだろう。--SCAT変数は--CAT変数で示されたグループを細分化する。

--GRPID変数は症例内のデータをまとめる
--CAT変数と異なり、--GRPID変数のスコープは狭い。同一USUBJIDの中でのみ有効である(※)。この値が同じだと、データがひとつながりであることを示せる。しかし、その射程範囲はUSUBJID内になる。以下に簡単な例を示す。

※C言語に例えるなら「関数内で宣言された変数」や「クラス内のPrivate変数」といったところ

USUBJID / MHGRPID / MHTERM
TKD1001 / 1 / 病気Aなんなー
TKD1001 / 1 / 症状A1なんなー
TKD1001 / . / 病気Xなのん
SMZ.1002 / 1 / 病気Bなん
SMZ.1002 / 1 / 症状B1なん

この事例では、MHGRPID=1のデータが4つある。しかし、データのグルーピングは2つである。なぜならば、症例番号を超えて--GRPID変数が効果を発揮しないからだ。

--LNKID変数/--LNKGRPは症例内で有効なリンク用変数
この変数はグルーピング以上の目的を持つ。この変数はドメインを跨いだデータを連結するためにある。有効範囲は同一症例内である。しかし、これは当然のことだ。データを連結するときに、異なる被験者のデータを結びつけることなどないだろう(※)。

※厳密に言えば、被験者とその関係者…の連携が意味を持つ場合がある。賢明な読者であれば、この関係性が別の標準で表現されることが分かるだろう。

その他の有効な変数
いくつかのTAUGでは、--REFID変数がデータをまとめたり、他のドメインとのデータ結合に用いられている。しかし、この変数の本質はグルーピングでもリンクでもない。特定の場合に……予め意図している・格納するデータがそのような性質を持っている……グルーピングやリンクに使えるだけである。また、この変数のコンテンツは症例を跨ぐかもしれない点に注意したい。

--RESCAT変数も存在する。これはFindings Classでのみ利用できる。その有効範囲は--ORRES変数に限定される(--ORRES変数のコンテンツがスコープ)。局所的なグルーピングには有効かもしれない。
前ページ | | 次ページ











管理者にだけ表示を許可する
http://doubledealer989.blog74.fc2.com/tb.php/1603-2cd326d8