JAICI からのお知らせ

2009 年 12 月 3 日 (木) STN 関連
DGENE, PCTGEN, USGENE ファイル - BLAST ホモロジー検索結果に対する強化

DGENE, PCTGEN, USGENE ファイルは,特許中の配列情報を収録するデータベースです.
これらのデータベースでは,完全配列検索や部分配列検索のほか,BLAST ホモロジー検索と,GETSIM (FASTA) ホモロジー検索を行うことができます.

2009 年 11 月 30 日に BLAST ホモロジー検索の回答セットに対する新しいソートオプションである IDENT が利用できるようになりました.

IDENT では BLAST ホモロジーの回答セットを同一性パーセント (Identities) で並べ替えることができます.つまり局所的な相同性でソートが出来るようになりました.
この同一性パーセントのソート機能は,全体的な相同性スコアが低く,局所的に高い相同性 (一致率) を有する短い配列を特定する場合に特に有用です.

IDENT と SCORE を同時に利用して回答のソートを行うと,回答がより見やすくなります.(下記の検索例参照)
さらに IDENT と SCORE でソートした回答セットに FSORT を適用すると,特許ファミリーごとに並べ替えることができます.それぞれのファミリー中の相同性によるソート順は保持されます.

このように,新しいソートオプションの追加により,BLAST 回答セットの表示がさらに柔軟になりました.

BLAST オンラインおよびバッチ検索,および BLAST アラート検索の結果に利用可能です.
(GETSIM ホモロジー検索では結果に Identities の値がないので利用できません.)

SORT IDENT コマンドに対する課金はありません.

■ 検索例

=> FILE DGENE

=> RUN BLAST L1/SQN -F F  <--- 配列質問式をアップロードし,BLAST ホモロジー検索を実行します
   :
 351 ANSWERS FOUND BELOW EXPECTATION VALUE OF 10.0

      QUERY SELF SCORE VALUE IS   496
      BEST ANSWER SCORE VALUE IS  496

Similarity <--- 類似性の高さ
Score
      496 |                                           
          |                                           
          |                                           
          |                                           
          |                                           
          |                                           
          |                                           
          |                                           
          |                                           
          ||||||||||||||||||||                        
      248 ||||||||||||||||||||||||                    
          ||||||||||||||||||||||||                    
          |||||||||||||||||||||||||                   
          |||||||||||||||||||||||||                   
          ||||||||||||||||||||||||||                  
          |||||||||||||||||||||||||||||||             
          |||||||||||||||||||||||||||||||             
          |||||||||||||||||||||||||||||||             
          ||||||||||||||||||||||||||||||||||||||||||||
          ||||||||||||||||||||||||||||||||||||||||||||
Answer Count      80       160       240       320       400 <--- 類似配列の件数

ENTER EITHER THE NUMBER OF ANSWERS YOU WISH TO KEEP
 OR ENTER MINIMUM PERCENT OF SELF SCORE FOLLOWED BY %
 (BEST ANSWER PERCENTAGE OF SELF SCORE IS 100%)     
ENTER (ALL) OR ? :ALL       <--- 全回答を得ます
L2    RUN STATEMENT CREATED
L2         351 GGAAGAGACCCTGCAAGATGCAAGCCTTCAGAATCTGGGATGTTAACCAG
               AAGACCTTCTACATGAGGAATAACCAACTAGTTGCTGGATACTTGCAAGA
               ATCAAATACTAAATTACAAGAGAAGATAGATGTGGTGCCCATTGAGCCTG
               ATGCTCTATTCCTGGGACTCCATGGGAGGAAGCTGTGCCTGGCCTGTGTC
               AAGTCTGGTGATGAGATTAGGTTCCAATTGGAGGCAGTTAACATCACTGA
               /SQN.-F F

Answer set arranged by accession number; to sort by descending
similarity score, enter at an arrow prompt (=>) "sor score d".

=> SORT IDENT D SCORE D      <--- 回答レコードを同一性と類似性の高い順に並び替えます
PROCESSING COMPLETED FOR L2  
L3          351 SOR L2 IDENT D SCORE D

=> D IDENT SCORE 1-10
 
L3    ANSWER 1 OF 351  DGENE  COPYRIGHT 2009 THOMSON REUTERS on STN 
IDENT 100%
SCORE 496      100% of query self score 496
        : 
L3    ANSWER 6 OF 351  DGENE  COPYRIGHT 2009 THOMSON REUTERS on STN 
IDENT 100%
SCORE 60      12% of query self score 496
        :
L3    ANSWER 8 OF 351  DGENE  COPYRIGHT 2009 THOMSON REUTERS on STN 
IDENT 100%
SCORE 56      11% of query self score 496
        : 

=> FSORT L3       <--- 回答レコードを同一特許 (または特許ファミリー) 毎に並べ替えます
    :
SEL L3 1- PN,APPS
L4          SEL L3 1- PN APPS :     649 TERMS


'L4' DELETED
L4          351 FSO L3

             63 Multi-record Families   Answers 1-296
                  Family 1                Answers 1-8
                  Family 2                Answers 9-11
                     :
                  Family 62               Answers 289-290
                  Family 63               Answers 291-296
             55 Individual Records      Answers 297-351
              0 Non-patent Records      

=> D PFAM =1 1-2 IDENT SCORE    <--- ファミリー 1 から 1-2 番目の回答の IDENT SCORE を表示します
 
L4    ANSWER 1 OF 351  DGENE  COPYRIGHT 2009 THOMSON REUTERS on STN FAMILY    1
IDENT 100%
SCORE 496      100% of query self score 496
 
L4    ANSWER 2 OF 351  DGENE  COPYRIGHT 2009 THOMSON REUTERS on STN FAMILY    1
IDENT 90%
SCORE 305      61% of query self score 496

=> D PFAM=1 1 TRIAL ALIGN SCORE
 
L4    ANSWER 1 OF 351  DGENE  COPYRIGHT 2009 THOMSON REUTERS on STN FAMILY    1
AN    ASS06733  cDNA       DGENE
TI    Providing to a mammal a mammalian Interleukin (IL)-1 Receptor antagonist
      (Ra) peptide or polypeptide, by introducing to cells or tissue of the
      mammal, a composition comprising a recombinant self-complimentary adeno-
      associated viral vector.
DESC  Horse Interleukin-1 receptor antagonist coding sequence, SEQ ID 11.
KW    ss; gene; IL1RA; Interleukin-1 receptor antagonist; antagonist;
      therapeutic; gene therapy; protein therapy; prophylactic to disease; drug
      delivery; vector; arthritis; antiarthritic; antiinflammatory;
      osteoarthritis; rheumatoid arthritis; immunosuppressive; injury;
      vulnerary; joint disease; periarticular joint disease;
      musculoskeletal-gen.; neuromuscular disease; neuroprotective; autoimmune
      disease; immunosuppressive.
SQL   534
BLASTALIGN
   Query  = 250 letters
   Length = 534
   Score  =  496 bits (250), Expect = e-145
   Identities = 250/250 (100%)
   Strand = Plus / Plus
                                                                         
  Query: 1   ggaagagaccctgcaagatgcaagccttcagaatctgggatgttaaccagaagaccttct
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Sbjct: 86  ggaagagaccctgcaagatgcaagccttcagaatctgggatgttaaccagaagaccttct
                                                                         
  Query: 61  acatgaggaataaccaactagttgctggatacttgcaagaatcaaatactaaattacaag
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Sbjct: 146 acatgaggaataaccaactagttgctggatacttgcaagaatcaaatactaaattacaag
                                                                         
  Query: 121 agaagatagatgtggtgcccattgagcctgatgctctattcctgggactccatgggagga
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Sbjct: 206 agaagatagatgtggtgcccattgagcctgatgctctattcctgggactccatgggagga
                                                                         
  Query: 181 agctgtgcctggcctgtgtcaagtctggtgatgagattaggttccaattggaggcagtta
             ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
  Sbjct: 266 agctgtgcctggcctgtgtcaagtctggtgatgagattaggttccaattggaggcagtta
                       
  Query: 241 acatcactga 250
             ||||||||||
  Sbjct: 326 acatcactga 335
SCORE 496      100% of query self score 496

-----------------------------------注意点 ----------------------------------------------

ホモロジー検索のアライメント情報はオンラインセッション中でのみ有効です.
このため,アライメント情報中の類似性でソートする機能もオンライン中でのみ有効です.

ホモロジー検索の回答セットは SAVE コマンドで保存できますが,アライメント情報の再現は保証されておりません.
そのため,アライメント情報のソートや表示は,ホモロジー検索を実行したオンラインセッション中に実行してください.

カテゴリー:
SciFinder SciFinder STN 関連 STN 関連   STN Express STN Express   STN on the Web STN on the Web
STN Easy STN Easy STN AnaVist STN AnaVist   STN Viewer STN Viewer   インターネットセミナー インターネットセミナー
イベント イベント   CAS の CD-ROM 製品関係 CAS の CD-ROM 製品関係 その他 その他