[miso-users] Question on the --compare-samples output file

Yarden Katz yarden at MIT.EDU
Wed Feb 15 18:14:39 EST 2012


Hi James,

See replies below:

On Feb 15, 2012, at 3:49 PM, Gao, James (NIH/NCI) [E] wrote:

> Hello Yarden,
> 
> I am working on a script to parse out the --compare-samples output file
> (python run_miso.py --compare-samples SE/control/ SE/knockdown/
> SE/comparisons/), and found out that for some events, the number of
> isoforms reported in the sample1_counts and sample2_counts columns do not
> always match the number reported in other columns. Such as in the record
> below, both sample1_counts and sample2_counts contain 7 comma separated
> numbers, whereas other columns contain 9. Is this type of output normal?
> 
> Thanks,
> 
> James

The sample1_counts/sample2_counts field will be bounded by the number of *read classes* present in the data.  For a gene with N many isoforms, there are basically 2^N many read classes, most of which will be present in the data (as you can see here, there are only 7 types of read classes, even though you have 9 isoforms.

Other fields will have an entry for each isoform, and so will have 9 fields.  For example, there will be a DeltaPsi field ("diff") saying what the difference is for each isoform across your two samples, resulting in 9 numbers in this case.  And similarly for the Bayes factor field.  

Note that the number of non-zero classes present can be different for sample1_counts and sample2_counts.  There are four possible read classes: (0,0), (0,1), (1,0), (1,1).  Suppose you have a gene with a single skipped exon, producing two isoforms, the first of which is the one containing the skipped exon.  If sample1 always skips the exon, you will have 0:(1,0), but if sample2 sometimes includes it, you can have N:(1,0) in the sample2_counts where N > 0. 

Hope this helps.

Best, --Yarden



> 
> 
> =======
> 
> ENSG00000182871	0.04,0.08,0.07,0.13,0.04,0.50,0.02,0.07,0.04	0.00,0.03,0.02
> ,0.02,0.00,0.25,0.00,0.02,0.02	0.11,0.18,0.17,0.29,0.15,0.67,0.10,0.17,0.09
> 	0.04,0.06,0.11,0.03,0.03,0.21,0.19,0.25,0.07	0.01,0.01,0.01,0.00,0.01,0.04
> ,0.07,0.04,0.03	0.16,0.16,0.35,0.09,0.07,0.51,0.35,0.45,0.15	0.00,0.03,-0.0
> 4,0.10,0.00,0.30,-0.17,-0.18,-0.03	0.08,0.25,0.21,0.27,0.09,1.91,12.03,1.33
> ,0.11	'exon:ENST00000359759:1_exon:ENST00000359759:2_exon:ENST00000359759:3
> _exon:ENST00000359759:4_exon:ENST00000359759:5_exon:ENST00000359759:6_exon:
> ENST00000359759:7_exon:ENST00000359759:8_exon:ENST00000359759:9_exon:ENST00
> 000359759:10_exon:ENST00000359759:11_exon:ENST00000359759:12_exon:ENST00000
> 359759:13_exon:ENST00000359759:14_exon:ENST00000359759:15_exon:ENST00000359
> 759:16_exon:ENST00000359759:17_exon:ENST00000359759:18_exon:ENST00000359759
> :19_exon:ENST00000359759:20_exon:ENST00000359759:21_exon:ENST00000359759:22
> _exon:ENST00000359759:23_exon:ENST00000359759:24_exon:ENST00000359759:25_ex
> on:ENST00000359759:26_exon:ENST00000359759:27_exon:ENST00000359759:28_exon:
> ENST00000359759:29_exon:ENST00000359759:30_exon:ENST00000359759:31_exon:ENS
> T00000359759:32_exon:ENST00000359759:33_exon:ENST00000359759:34_exon:ENST00
> 000359759:35_exon:ENST00000359759:36_exon:ENST00000359759:37_exon:ENST00000
> 359759:38_exon:ENST00000359759:39_exon:ENST00000359759:40_exon:ENST00000359
> 759:41','exon:ENST00000355480:1_exon:ENST00000355480:2_exon:ENST00000355480
> :3_exon:ENST00000355480:4_exon:ENST00000355480:5_exon:ENST00000355480:6_exo
> n:ENST00000355480:7_exon:ENST00000355480:8_exon:ENST00000355480:9_exon:ENST
> 00000355480:10_exon:ENST00000355480:11_exon:ENST00000355480:12_exon:ENST000
> 00355480:13_exon:ENST00000355480:14_exon:ENST00000355480:15_exon:ENST000003
> 55480:16_exon:ENST00000355480:17_exon:ENST00000355480:18_exon:ENST000003554
> 80:19_exon:ENST00000355480:20_exon:ENST00000355480:21_exon:ENST00000355480:
> 22_exon:ENST00000355480:23_exon:ENST00000355480:24_exon:ENST00000355480:25_
> exon:ENST00000355480:26_exon:ENST00000355480:27_exon:ENST00000355480:28_exo
> n:ENST00000355480:29_exon:ENST00000355480:30_exon:ENST00000355480:31_exon:E
> NST00000355480:32_exon:ENST00000355480:33_exon:ENST00000355480:34_exon:ENST
> 00000355480:35_exon:ENST00000355480:36_exon:ENST00000355480:37_exon:ENST000
> 00355480:38_exon:ENST00000355480:39_exon:ENST00000355480:40_exon:ENST000003
> 55480:41','exon:ENST00000423214:1_exon:ENST00000423214:2_exon:ENST000004232
> 14:3_exon:ENST00000423214:4_exon:ENST00000423214:5_exon:ENST00000423214:6',
> 'exon:ENST00000459895:1_exon:ENST00000459895:2_exon:ENST00000459895:3_exon:
> ENST00000459895:4_exon:ENST00000459895:5_exon:ENST00000459895:6_exon:ENST00
> 000459895:7_exon:ENST00000459895:8','exon:ENST00000539645:1_exon:ENST000005
> 39645:2_exon:ENST00000539645:3_exon:ENST00000539645:4_exon:ENST00000539645:
> 5_exon:ENST00000539645:6_exon:ENST00000539645:7_exon:ENST00000539645:8_exon
> :ENST00000539645:9_exon:ENST00000539645:10_exon:ENST00000539645:11_exon:ENS
> T00000539645:12_exon:ENST00000539645:13_exon:ENST00000539645:14_exon:ENST00
> 000539645:15_exon:ENST00000539645:16_exon:ENST00000539645:17_exon:ENST00000
> 539645:18_exon:ENST00000539645:19_exon:ENST00000539645:20_exon:ENST00000539
> 645:21_exon:ENST00000539645:22_exon:ENST00000539645:23_exon:ENST00000539645
> :24_exon:ENST00000539645:25_exon:ENST00000539645:26_exon:ENST00000539645:27
> _exon:ENST00000539645:28_exon:ENST00000539645:29_exon:ENST00000539645:30_ex
> on:ENST00000539645:31_exon:ENST00000539645:32_exon:ENST00000539645:33_exon:
> ENST00000539645:34_exon:ENST00000539645:35_exon:ENST00000539645:36_exon:ENS
> T00000539645:37_exon:ENST00000539645:38_exon:ENST00000539645:39_exon:ENST00
> 000539645:40','exon:ENST00000342220:1_exon:ENST00000342220:2_exon:ENST00000
> 342220:3_exon:ENST00000342220:4_exon:ENST00000342220:5_exon:ENST00000342220
> :6_exon:ENST00000342220:7_exon:ENST00000342220:8_exon:ENST00000342220:9_exo
> n:ENST00000342220:10_exon:ENST00000342220:11_exon:ENST00000342220:12_exon:E
> NST00000342220:13_exon:ENST00000342220:14_exon:ENST00000342220:15_exon:ENST
> 00000342220:16_exon:ENST00000342220:17_exon:ENST00000342220:18_exon:ENST000
> 00342220:19_exon:ENST00000342220:20_exon:ENST00000342220:21_exon:ENST000003
> 42220:22_exon:ENST00000342220:23','exon:ENST00000400347:1_exon:ENST00000400
> 347:2_exon:ENST00000400347:3_exon:ENST00000400347:4_exon:ENST00000400347:5_
> exon:ENST00000400347:6_exon:ENST00000400347:7_exon:ENST00000400347:8_exon:E
> NST00000400347:9_exon:ENST00000400347:10_exon:ENST00000400347:11_exon:ENST0
> 0000400347:12_exon:ENST00000400347:13_exon:ENST00000400347:14_exon:ENST0000
> 0400347:15_exon:ENST00000400347:16_exon:ENST00000400347:17_exon:ENST0000040
> 0347:18_exon:ENST00000400347:19_exon:ENST00000400347:20_exon:ENST0000040034
> 7:21_exon:ENST00000400347:22_exon:ENST00000400347:23_exon:ENST00000400347:2
> 4_exon:ENST00000400347:25_exon:ENST00000400347:26_exon:ENST00000400347:27_e
> xon:ENST00000400347:28_exon:ENST00000400347:29_exon:ENST00000400347:30_exon
> :ENST00000400347:31_exon:ENST00000400347:32_exon:ENST00000400347:33_exon:EN
> ST00000400347:34_exon:ENST00000400347:35_exon:ENST00000400347:36_exon:ENST0
> 0000400347:37_exon:ENST00000400347:38_exon:ENST00000400347:39_exon:ENST0000
> 0400347:40_exon:ENST00000400347:41','exon:ENST00000400337:1_exon:ENST000004
> 00337:2_exon:ENST00000400337:3_exon:ENST00000400337:4_exon:ENST00000400337:
> 5_exon:ENST00000400337:6_exon:ENST00000400337:7_exon:ENST00000400337:8_exon
> :ENST00000400337:9_exon:ENST00000400337:10_exon:ENST00000400337:11_exon:ENS
> T00000400337:12_exon:ENST00000400337:13_exon:ENST00000400337:14_exon:ENST00
> 000400337:15_exon:ENST00000400337:16_exon:ENST00000400337:17_exon:ENST00000
> 400337:18_exon:ENST00000400337:19_exon:ENST00000400337:20_exon:ENST00000400
> 337:21_exon:ENST00000400337:22_exon:ENST00000400337:23_exon:ENST00000400337
> :24_exon:ENST00000400337:25_exon:ENST00000400337:26_exon:ENST00000400337:27
> _exon:ENST00000400337:28_exon:ENST00000400337:29_exon:ENST00000400337:30_ex
> on:ENST00000400337:31_exon:ENST00000400337:32_exon:ENST00000400337:33_exon:
> ENST00000400337:34_exon:ENST00000400337:35_exon:ENST00000400337:36_exon:ENS
> T00000400337:37_exon:ENST00000400337:38_exon:ENST00000400337:39_exon:ENST00
> 000400337:40_exon:ENST00000400337:41_exon:ENST00000400337:42','exon:ENST000
> 00473212:1_exon:ENST00000473212:2_exon:ENST00000473212:3_exon:ENST000004732
> 12:4_exon:ENST00000473212:5'	(0,0,0,0,0,0,0,0,0):1224,(0,0,0,0,0,0,0,0,1):2
> ,(1,1,0,0,0,0,0,1,0):2,(1,1,0,0,1,0,1,1,0):4,(1,1,0,0,1,1,1,1,0):47,(1,1,0,
> 0,1,1,1,1,1):2,(1,1,1,0,1,1,1,1,1):1	0:1,1:9,2:0,3:0,4:1,5:39,6:3,7:3,8:2	(
> 0,0,0,0,0,0,0,0,0):752,(0,0,0,0,0,0,0,0,1):1,(0,0,1,0,0,0,0,0,0):1,(1,1,0,0
> ,1,0,1,1,0):12,(1,1,0,0,1,1,1,1,0):39,(1,1,0,0,1,1,1,1,1):4,(1,1,1,0,1,1,1,
> 1,1):2	0:0,1:3,2:2,3:0,4:3,5:8,6:27,7:15,8:1	chr21	NA	46875424,46875403,469
> 25272,46913109,46875445,46910189,46825088,46825052,46925933	46933633,469336
> 34,46932177,46917726,46933633,46933634,46933633,46933634,46932481
> 
> 
> 
> _______________________________________________
> miso-users mailing list
> miso-users at mit.edu
> http://mailman.mit.edu/mailman/listinfo/miso-users




More information about the miso-users mailing list