Contents:

Authors

carushi

Bioinformatics

How much?

シーケンサーの値段・性能まとめ(一例)

会社 機種 性能 (Gb) 価格 価格 (run)
Illumina MiniSeq 7.5 $50,000
MiSeq 15 $100,000 ~10,0000円
NextSeq 120 $250,000
Hiseq 1500 $740,000
HiSeq X 1800 (フローセル2枚分) $1,000,000 $1000 / hs genome 30x ?
Reference

(16.06.04時点調べ、コメント歓迎)

Differential gene expression analyses

edgeR

Cuffdiff

DEseq2

Go enrichment

How to use readthedocs

New project hosted by github

Creat a new sphinx project

私はMathJaxはenabledにしてみました。 設定は後からconf.pyから変更可能です。

  • .gitignore設定

    echo docs/\_build/* > .gitignore
    

sphinx-quickstartの時点でbuildとsourceを別々にする設定にすると、_buildディレクトリにならないので注意。

  • ファイルをgithubにpushしておく

    git add -A
    git commit -m'<comment>'
    git push origin <branch>
    
  • localでhtmlを確認

    make html
    

で_build以下にhtmlファイルができるが、readthedocsではsphinx rds templateが適用されるので見た目違うものになる。

Use readthedocs template

Settings of Readthedocs

githubのアドレスを指定する

  • Admin -> Repository URLでdocumentが入っているレポジトリを指定

buildに失敗する

数式サポート

  • conf.pyのextensionsに’sphinx.ext.mathbase’を追加

    .. math::
        \sum \infty
    
  • こうなる→

\[\sum \infty\]

Google analytics

  • Admin -> Advanced settingにトラックコードを追加

MySQL

How to start mysql server and input source

brewでmysql.serverを入れてMySQLサーバをローカルで走らせます。

共有する場合にはパスワードなどを真面目にやらないといけないと思いますが、手元でsqlデータセットを見たいときを想定しています。 なので使わないときにはstopしておきます。

mysql.server start
mysql -u root
mysql> SET PASSWORD FOR root@localhost=PASSWORD('hoge')
mysql> exit
mysql -u root -h localhost -p #passwordを要求される
mysql.server stop

Test set

Employdbというやつのfull setを落としてきました。 https://launchpad.net/test-db/+download fileをimportすると、データベース名が表示されます。

mysql> SOURCE file;
mysql> SHOW DATABASES;
使用するときにはuseでデータベース名を指定します。
mysql> USE db;

このときMysqlのバージョン違いから、storange_engine変数がないというエラーが出たので、本文中の

-- set storage_engine = InnoDB error

をコメントアウトしておきました。 新しいバージョンではなくなった変数だそうです。

stopしてもサーバーにデータは残っていますので、データベースを消去するときは

DROP DATABASE IF EXITSTS db;

で消せます。 http://www.liquidweb.com/kb/delete-a-mysql-database-on-linux-via-command-line/

Manage database

とりあえず表示

とりあえず表示したいときには

SELECT * FROM tablename WHERE 条件 LIMIT start,number

で表示できます。 あとは条件文を設定して絞っていくことになります。

https://technet.microsoft.com/en-us/library/bb264565(v=sql.90).aspx

PyMySQLを使う

Python.2.x環境のようなので、2で使っています。

https://donjajo.com/using-pymysql-as-mysql-driver-for-python3/#.V33kSZN972I

GUIでMySQLのデータセットを管理

macOSではSequel Proが使いやすそうだと思い入れてみました。 tablesの一覧を出してくれて便利。

Rでcopula

Packages

copulaを推定するためのRパッケージ、いろいろあります。 * GOFcopula * copulaGOF * copula * VineCopula

alternate text

copulaをダウンロード

スライドで紹介されていたcopulaGOFが見つからなかったので、copulaをダウンロードしました。

install.package("copula")

What is copula?

二つ以上の周辺化確率分布からJoint probability distributionを出力する関数。KendallやSpearmanの順位相関検定などと深い関わりがある。 ガウシアンやStudent、アルキメディアンコピュラなどにフィッティングすることで、多変量の確率分布から同時確率分布をモデル化できる。

j

RNA structure papers

RNAex: an RNA secondary structure prediction server enhanced by high-throughput structure-probing data

  • Yang Wu, Rihao Qu, Yiming Huang, Binbin Shi, Mengrong Liu, Yang Li, and Zhi John Lu*
  • April, 2016.
  • RNAex server to access structure probing data
  • in vivo and in vitro
  • in silico: MaxExpect, SeqFold, RNAstructure, and RNAfold
    • RNA editing, RNA modification, SNP sites
Species Method Sample
Homo sapiens DMS-seq PARS K562 trio
Arabi DMS-seq  
Mouse icSHAPE Frag-seq CIRS-seq  

A comprehensive database of high-throughput sequencing-based RNA secondary structure probing data (Structure Surfer)

  • Nathan D. Berkowitz, Ian M. Silverman, Daniel M. Childress, Hilal Kazan, Li-San Wang, and Brian D. Gregory
  • May, 2016.
  • ds/ssRNA-seq (RNaseONE ss and RNase V1 ds)
\[S_i = \log_2 \frac{ONE_i + 1}{V_{1j}+1}\]
  • similar to PARS
\[S_i = \log_2 (\sum \frac{V_{1j}+5}{5} )- \log_2 (\sum \frac{S_{1j}+5}{5})\]
  • DMS-seq (in vivo)
\[R_i = \frac{D_i / D_{max}}{C_i / C_{max}}\]
  • icSHAPE (in vivo)
\[R_i = (D_i - C_i) / B\]

The RNA structurome: transcriptome-wide structure probing with next-generation sequencing.

  • Chun Kit Kwok, Yin Tang, Sarah M. Assmann, and Philip C. Bevilacqua.
  • April, 2015.
sample Name Probing method Features Paper
in vitro PARS RNase S1 & V1 cleavage Kertesz, et al. 2010. Nature
PARTE RNase V1 Wan, et al. 2012. Mol. cell.
FragSeq Nuclease P1 cleavage Underwood, et al. 2010. Nat. Met.
SHAPE 2’-hydroxyl acylation RT stops Lucks, et al. 2011. PNAS.
ds/ssRNA-seq RNase ONE & V1 cleavage Li, et al. 2012. Cell reports.
Map-Seq DMS, CMCT, 1M7 Smola, et al. 2014. Protocol RNA.
HRF-Seq hydroxyl radicals break acc region Kielpinski, et al. 2014. NAR.
ChemModSeq 2’-hydroxyl acylation Hector, et al. 2014. NAR.
RING-MaP DMS mutational profiling Homan, et al. 2014. PNAS.
SHAPE-MaP 2M7, 1M6, NMIA mutational profiling Smola, et al. 2015. Nat. Prot.
in vivo DMS-seq DMS modification (+DMS-AC?) Rouskin, et al. 2014. Nature.
Mod-seq Talkish, et al. 2014. RNA.
Structure-seq Ding, et al. 2014. Nat. Prot.
CIRS-seq CMCT, DMS G and AC Incarnato, et al. 2014. Genome Biol.
icSHAPE NAI-N3 AU rich? Spittle, et al. 2015. Nature.

Indices and tables