bootstrap是对观测数据集进行有放回(replacement)的随机抽样,以评估总体的各项统计指标。可以用于假设检验、参数估计。好处是并不要求大样本,也不要求正态数据,并且对于不同的统计指标使用的是同样的计算方法。结果也更为可靠,坏处是计算量大。
统计推断(statistical inference)是基于样本统计值的抽样分布来计算的,抽样分布需要从总体中许多的样本来计算,在只有一个样本的情况下,bootstrap对这一随机样本进行有放回的重复抽样,每一个重抽样本与原始随机样本一样大,每次计算相应的抽样的统计值,重复了N次之后,就可以计算统计值的bootstrap分布。
下面做一个小小的试验:
a <- c(seq(1:10), rnorm(50)) #创建一个样本,60个数据,非正态分布的,如下图

b <- rep(0, 1000)
for (i in 1:1000) {
b[i] <- mean(sample(a, replace=TRUE))
}
对它进行1000次有放回重复抽样,计算均值,均值分布的柱状图和qq图如下:

分布是正态的。
> mean(a) #样本均值
[1] 0.947186
> mean(b) #重抽样1000个样本均值的均值
[1] 0.9358049
> sd(b)
[1] 0.3245479
> sd(a)/sqrt(60)
[1] 0.3318863
由bootstrap方法得到的标准误是0.325,而由原先随机样本所估算的是0.332,两者是相当接近的。由此可见呢,bootstrap方法与理论上的从总体中抽样所得到的样本分布是一致的,这样子就可以基于一个样本来计算样本的分布,而不是要从总体中抽N个样本。
Read the rest of this entry »
July 31st, 2009 in
Mathematics | tags:
R,
statistics |
378 views |
8 Comments
男人的性染色体是XY型,女人是XX型,几乎没有不知道的,但大多数人也只是知道这一点而已,包括很多学医的,学生物的,所以一直以来,我想写这样一篇blog科普一下。
当年在安医的时候,刚入学时有个生物的考试,调查一下学生整体的生物水平,都是一些常识性的判断题,这简直就是对专业人士的侮辱。比如说细胞都有个细胞核,众人皆答对,我对旁边的人说,想想血红细胞吧,纷纷改成错。还比如男人的性染色体是XY型,众人亦答对,我说是错的,没人理我,能问出这么一大堆弱智题目的考卷,它的标准答案肯定是对的,但我坚持答真理 -,-
首先,性状是由基因所决定的,当然基因并不能决定一切,基因的表达是受调控的,而调控是多层次的,更多的时候,基因扮演的是一个被动的角色。DNA实在是太长了,它必须要组织起来,而各个层面上的组织本身也提供了调控的一种方式。试想一下,如果只有在一个层面上调控,需要1000000种调控的话,那是多么复杂的事情,如果可以在两种层面上调控的话,每个层面只需要1000种,如果是三个层面的话,每个层面只需要100种。多层次的调控,才能灵活而有效。
而染色体是什么?染色体是DNA的一种组织形式。仅此而已,当然它本身也能调控基因的表达,像女性XX两条性染色体会随机失活一条,就是在染色体的层面上实现的。染色体它是DNA的组织形式,不管是性染色体还是常染色体,皆是如此,性染色体并不决定性别。决定性别的是性染色体上决定性别的那些基因。当然这些基因通常只出现于性染色体上,在遗传学上,我们可以称之为连锁,当然连锁的概念是指基因与基因在遗传上有你有我,可以看成是一个遗传单元,但不防把概念扩展一下。决定性别的基因与性染色体连锁。
这个世界上是否存在XX型的男人?是否存在XY型的女人?答案是肯定的。决定性别的基因,它并不一定要出现在性染色体上,所有的机制都有出错的可能性,在遗传上保证遗传信息的多样性并不靠出错,而是组合,以及染色体间的易位(互相交换片段)。所以如果Y染色体上决定男性的基因跑到常染色体上去了,那么,即使性染色体的组合是XX型,那也会是一个男人。而如果Y染色体上决定男性的基因丢失了,常染色体上也没有copy的话,那即便是XY型,也会是一个女人。当然即便基因只是换了个位置而已,因为基因周围的微环境也会有些改变,基因的表达调控也会跟着变化,表达量上可能会有差异,性状上也可能会有些差异,可以把它当成是一种罕见的遗传病。XX型的男人,XY型的女人,人群中确实是有的,当然概率是相当的低。
最后来张图,我用R画的,白条标示的是基因的位置。有兴趣的话,移步 http://bioconductor.org/packages/release/bioc/html/geneplotter.html

July 31st, 2009 in
Biology | tags:
genetics |
340 views |
15 Comments
这是写给Liz的,不需要换域名的,不想让别人看的话,最好的办法,是不要放在网上。 =,=
不过还好,花20%的精力可以解决80%的问题 -,- 电脑白痴比较多,所以,基本上稍加限制就OK了。
鉴于你是懒人,Step by Step好了。
1.安装插件
需要一个叫WP-Ban的东东,主页在http://lesterchan.net/wordpress/readme/wp-ban.html
你也可以从这里,直接点wp-ban.1.40.zip下载。
安装

激活

Read the rest of this entry »
June 9th, 2009 in
Computer Science | tags:
wordpress |
169 views |
1 Comment
May 12th, 2009 in
My Life | tags:
journey |
61 views |
Enter your password to view comments
April 25th, 2009 in
My Life | tags:
AHMU |
132 views |
Enter your password to view comments