巅峰体育

Hi, 请登录

罗纳德费希尔(费尔纳德斯)

极大似然估计步骤

1.求极大似然估计的一般步骤:

(1) 写出似然函数;

(2) 对似然函数取对数,并整理;

(3) 求导数 ;

(4) 解似然方程 。

2.利用高等数学中求多元函数的极值的方法,有以下极大似然估计法的具体做法:

(1)根据总体的分布,建立似然函数 ;

(2) 当 L 关于 可微时,(由微积分求极值的原理)可由方程组定出,称以上方程组为似然方程.

因为 L 与 有相同的极大值点,所以也可由方程组定出 ,称以上方程组为对数似然方程; 就是所求参数的极大似然估计量。当总体是离散型的,将上面的概率密度函数,换成它的分布律

极大似然估计方法(Maximum Likelihood Estimate,MLE)也称为最大概似估计或最大似然估计,是求估计的另一种方法,最大概似是1821年首先由德国数学家高斯(C. F. Gauss)提出,但是这个方法通常被归功于英国的统计学家。罗纳德·费希尔(R. A. Fisher)。

极大似然估计方法是求估计的另一种方法,1821年首先由德国数学家C. F. Gauss(高斯)提出,但是这个方法通常被归功于英国的统计学家R. A. Fisher(罗纳德·费希尔)。

零假设的趣闻

人们通常认为科学家的工作是证明一个假设的正确性——比如说电子的存在,或者某个药物可以治愈癌症。但是,大部分时候,科学家做着相反的工作:他们需要推翻假设。

这个方法经过科学家们数十年的发展和完善,但是20世纪20年代初的一个下午在这段历史过程中尤其引人注目。那是在英格兰的一个农业研究站,三位科学家在喝下午茶。一位叫做罗纳德·费希尔(Ronald Fisher)的统计学家倒了一杯奶茶端给了他的同事,穆丽尔·布里斯托(Muriel Bristol)。

布里斯托拒绝了这杯茶。她更喜欢先倒牛奶后倒茶的味道。

“怎么可能。”据说费希尔这样回答道,“先倒牛奶还是后倒牛奶当然没有区别。”

但是布里斯托态度坚定。她坚持说,她可以尝出其中的区别。

对话的第三个科学家,威廉姆·洛奇(William Roach),建议大家做个试验。(这或许其实是个科学勾搭的时刻:布里斯托和洛奇1923年结婚了。)

但是如何测试布里斯托的宣称呢?费希尔和洛奇能做的最简单的事情,就是倒一杯奶茶,不让布里斯托看见,然后给她尝,看她能不能猜对是先加的奶还是先加的茶。

不过,就算她说对了,也并不见得能证明她对茶的有着独到的鉴赏力。考虑到有50%的概率可以答对,她完全可以全靠蒙来猜中答案。

多年之后,费希尔在他1935出版的书《实验设计》中描述了应该如何检验这样的宣称。他不是去试图证明布里斯托可以尝出两种茶的区别,而是试图驳斥这样的假设:“布里斯托的选择是随机的”。“我们可以称这样的假设为‘零假设’,”费希尔写到,“零假设永远无法证明或者确定,但是可能通过实验手段被否定。可以说,每个实验存在的目的,都不过是为了给事实提供一个机会去推翻零假设。”

费希尔概述了一种方式来驳斥零假设——布里斯托的选择是随机的。他会准备8杯茶,4杯先放牛奶,4杯后放牛奶。然后他会打乱杯子的顺序,让布里斯托每次品尝一杯。她需要将8杯茶分两组,一组她认为是先放了牛奶的,另外一组是后放了牛奶的。

据说布里斯托不费吹灰之力满分过关,正确地分辨出全部8杯茶。由于费希尔的实验设计,她全靠瞎猜将8杯茶全部正确分类的概率很小。8杯茶平分成2组有整整70种不同组合,也就是说布里斯托完全蒙对答案的概率只有1/70。

费希尔的检测依然不能完全排除布里斯托是猜对的可能性。只是说,她都是猜对的可能性很小。他可以通过让布里斯托喝更多的茶进一步降低这种可能性,但是他永远不可能把这种可能性降到0。

既然绝对的证明是不可能的,费希尔在做实验的时候更倾向于考虑可操作性。在他和布里斯托工作的农业实验室,费希尔的工作就是分析几十年采集的数据来确定这些信息是否有价值,比如,能判断出作物肥料的最佳配方是什么。科学家可以用这些数据来设计规模更大的实验来得到更精确的结果。费希尔认为,设计一个需要历经数百年才能得到结果的实验没有任何意义。他相信,等到可能性低到一定程度的时候,见好就收也足够了。

他认为5%就是一个合理的阈值。如果我们假定某个零假设是正确的,却发现在零假设下观察到这种数据的概率不到5%,那我们就可以很安全地“拒绝”零假设了。在布里斯托的例子中,她猜对的概率远远小于费希尔的阈值,只有1.4%。

很大程度上多亏了费希尔,零假设已经成为了科学发现的一个重要工具。你可以在每一个科学分支找到零假设的影子,从心理学到病毒学到宇宙学。并且,科学家们延续了费希尔5%的阈值概率。

动物有审美能力吗?

文章来源于:知识分子 《动物有审美能力吗?》

   总编按

本文作者是一位鸟类学家,而我是古鸟类学家,本文提到的理查德·普鲁姆所著的《美的进化》一书,都曾引起了我们的共鸣。当我还在美国堪萨斯大学读博士的时候,普鲁姆不仅是我选修的鸟类学课程的授课老师,而且给我印象最深的一课就是他曾经带领我们到野外住在帐篷中现场观看鸟类的求偶表演,带给我的震撼至今难忘。主流观点一般认为,性选择是自然选择的一种特殊形式,然而《美的进化》一书表达的是另外一种观点,本文作者在此做了进一步的介绍。《美的进化》出版后广受关注,还曾获得了2018年美国普利策奖提名。无论普鲁姆的观点最终能否被学界广为接受,它带给我们的思考相信不会被人忘记。 

——周忠和 《知识分子》总编辑

撰文| 陈水华

责编| 陈晓雪

德国著名博物学家恩斯特·海克尔(Ernst Haeckel,1834-1919)在1899年至1904年间,陆续出版了影响广泛的《自然的艺术形态》[1]。海克尔一生多才多艺,是生态学的创始人,也是著名艺术家和哲学家,其阐述一元论哲学的巨著《宇宙之谜》曾对青年毛泽东产生重要的影响,他也被毛泽东认为是影响自己世界观形成的四位德国哲学家之一。《自然的艺术形态》描述绘制了动植物世界绚丽多姿的形态之美。花卉、水母、海葵、贝壳、虾蟹、昆虫、热带鱼、蛙类、蜥蜴、鸟类……

在我们身边,自然之美无处不在。有些动物类群,在人类看来,其形态之美甚至达到了无以复加的程度,比如蝴蝶、热带鱼和鸟类。当然,这些美的形态,不可能是出于人类欣赏的需要,因为早在人类出现之前,它们就已经在这个世界长期生存了。而进化生物学告诉我们,自然界中所有奇迹的出现,绝非出于偶然。那么,难道是出于这些动物自身的审美需要吗?

在《物种起源》出版之后,达尔文受到了大量的质疑。其中,给他造成最大困扰的是孔雀的尾巴。1860年在写给美国生物学家亚萨·格雷(Asa Gray)的一封信中,达尔文对孔雀的尾巴大发牢骚:“那些雄孔雀尾巴上的羽毛,无论我什么时候看见,都不胜厌烦。” 达尔文为什么害怕看到孔雀的尾巴?因为孔雀的长尾巴和华丽的图案看起来没有任何实用价值,对于孔雀的生存反而是个累赘,不可能是自然选择的结果。

为了进一步阐明人类的进化机制,以及回答类似孔雀尾巴之类无用装饰器官存在的谜题,1871年,达尔文又出版了《人类的由来和性选择》,提出了生物进化的第二个机制——性选择。他系统梳理了昆虫、鱼类、两栖类、爬行类、鸟类和兽类的性选择现象,提出了一个长期被质疑、遭到忽视的观点:动物具有审美能力[2]。

2017年,一本名为《美的进化》书籍的出版,将这一观点重新带回人们的视野。作者是美国耶鲁大学鸟类学家理查德·普鲁姆(Richard Prum)教授。《美的进化》出版后,引起了广泛关注,甚至是一片哗然。因为普鲁姆在书中提出了一个革命性的观点:鸟类的羽毛之所以如此绚丽多彩,完全是鸟类出于审美的需要[3]。

当然,普鲁姆强调,这个观点不是他的首创,而是达尔文早在《人类的由来和性选择》中就提出来了。然而,达尔文的这个观点自提出之日就遭到了普遍的反对,其中最激烈的批评来自昔日的同伴——和他共同发现自然选择机制的阿尔弗雷德·华莱士。

华莱士认为,那些炫耀特征之所以会被配偶选中,是因为如实反映了拥有者的身体素质和健康状况。这是持续到今天有关性选择的主流观点,这个观点也被称为性选择的“素质论” 和 “诚实信号假说”。

1915年,英国遗传学家罗纳德·费希尔(Ronald Fisher)提出了“失控选择模式”,认为那些炫耀特征虽然反映了拥有者的素质,但也确实给了选择者以美感,这也导致炫耀特征和择偶偏好的协同进化,并逐渐失控,最后,对美的渴望超过了对素质的渴望[4]。

费希尔的论点虽然发展了达尔文的审美观,但仍属于非主流的观点。1975年,以色列演化生物学家阿莫茨·扎哈维(Amotz Zahavi)提出“不利条件原理” [5],为素质论提供了看似完美的解释:“任何炫耀行为的本质在于,它对信号发出方来说,是一个代价很大的负担,即一个不利条件。装饰性不利条件的存在,证明了信号发出者优秀的素质,因为它即使在这种条件下仍然有能力生存。”

扎哈维关于“不利条件原理” 论文的发表在科学界引起了轰动,更是彻底将动物的审美观打入了冷宫。

与多数生物学家不同,普鲁姆反对性选择中的素质论、诚实信号假说和不利条件原理,普鲁姆把它们统统称为“适应主义者”。普鲁姆认为,类似孔雀尾巴这样无用的装饰器官并不反映拥有者的素质,只是动物审美能力随机进化的结果。

他秉持达尔文最初的观点,认为美的进化的主要原因,在于它让观察者感到愉悦,与拥有者的潜在素质无关。炫耀特征与“美的标准” 协同进化,互相影响,逐渐加强。普鲁姆认为,这一观点长期以来被生物学家们有意忽视,被当成了 “阁楼上的疯女人”,无人提及。因此,普鲁姆给《美的进化》取的副标题是:“被遗忘的达尔文配偶选择理论如何塑造了动物世界以及我们”。

普鲁姆从自己的研究出发,列举了大量的研究案例,指出所有动物,从蚱蜢到飞蛾,从鱼到鸟,都具有审美能力。普鲁姆提出,美的进化并不总是带来新的适应,有时也带来适应的退化。他质问道:“与掌握完整基因组信息的科学家相比,一只雌性大眼斑雉怎么可能感知到潜在配偶的遗传素质呢?” 大眼斑雉是一种生活在婆罗洲热带雨林深处隐秘的雉类,和孔雀一样,雄性大眼斑雉有着美丽的尾羽,和炫目的带眼斑的羽色,因而也成为探讨性选择和炫耀特征进化的典型物种。

2002年2月,我有机会访问美国堪萨斯大学自然博物馆,曾与普鲁姆教授有一面之缘。当时,他是博物馆的研究人员,他和他的同事非常友善地接待了我,并向我介绍了他的恐龙羽毛和鸟类羽毛的起源研究。所以,当我阅读他基于鸟类羽毛研究的理论专著——《美的进化》时,心中多了几分亲切。

但作为长期在素质论熏陶下成长起来的生物学家,我对他的论述也颇多质疑。我想,普鲁姆在写作的过程中,一定感受到了同行质疑的压力,因为他花了大量的篇幅进行辩驳,尤其是针对进化生物学的素质论者和进化心理学家。这也导致这本书专业性较强,对于普通读者来说有点晦涩,没那么通俗易懂。在阅读的过程中,我能感受到普鲁姆的激愤,甚至无力感。对于绝大多数读者来说,《美的进化》是日常遇见书籍的一本,读过也就算了。即便是同行,也是聚在一起的时候,议论一阵,然后把其中的观点搁置一边,有少数认真的,会发文质疑几句,就像当年达尔文提出同样观点时的遭遇。连达尔文都遭遇了忽视和质疑,更何况普鲁姆。

有没有可能普鲁姆是对的呢?因为与普鲁姆有过一面之缘,并为他的真诚所打动,这个问题出现在我心中,并挥之不去,这导致我回头重读《美的进化》。在重读的过程中,我放弃了质疑普鲁姆的立场,仔细斟酌他的观点,忽然理解了达尔文和普鲁姆的想法:动物确实具有审美能力,只有这样,一切才说得通,性选择才能实施。

其实,性选择的素质论与普鲁姆的审美观并不存在根本的冲突,两者都有道理,但都失之偏颇。它们分别回答了性选择的两个环节:素质论回答的是选择的原因,为什么这样选择。而审美观回答的是选择的机制,如何进行选择。素质论过度强调了选择的原因,忽视了选择的机制。而普鲁姆则是过度强调了选择的机制,忽视了美感发生的原因,也即是审美的起源。

让我们重新面对普鲁姆的质问:一只雌性大眼斑雉怎么可能感知到潜在配偶的遗传素质呢?

今天,即使利用先进的知识和科学工具,要准确评估动物的遗传素质并预测其未来的健康状况都非常困难。这些雌性大眼斑雉,在评估潜在配偶素质时,既不验血、做B超,也不使用血压计、听诊器和心电图机,如何靠观颜察色,就能比人类医生更好地评估它们潜在配偶的健康状况呢?这确实是性选择理论长期忽视的问题。对于动物们是怎么判断对方素质的,即便像杰里·科因(Jerry Coyne)、贾雷德·戴蒙德(Jared Diamond)、理查德·道金斯(Richard Dawkins)和爱德华·威尔逊(Edward O. Wilson)这样的进化生物学大家,在其著作中都没有意识到这个问题。

在《第三种黑猩猩》中,贾雷德·戴蒙德以园丁鸟为例,这样阐述性选择中的素质论[6]:

“园丁鸟是分布在澳大利亚、新几内亚的一类鸟,它们的雄鸟在繁殖期会用树枝和五颜六色的装饰品搭建一座花亭,唯一的目的,就是吸引雌鸟,达到交配的目的…… 当雌鸟发现了一个它喜欢的花亭,立刻可以断定,‘那是只很强壮的雄鸟’,因为那个花亭的重量是雄鸟体重的几百倍,而且有些装饰品重达它体重的一半,必须从12码外抬回来。它知道雄鸟非常灵巧,因为把几百根树枝编成小屋、塔或墙,并不容易。雄鸟必然很聪明,不然无法依据复杂的设计建造成品。雄鸟的视力、记忆力都不错,不然无法在丛林中找到适当的建材、装饰品。雄鸟必然懂得生存之道,不然无法活得长久,学会足够的技巧,建造吸引雌鸟的花亭。还有,那只雄鸟的社会地位必然很高,因为雄鸟没事就较量高低,而且会互相偷取建材、装饰品,甚至破坏他人的花亭。威震群雄的雄鸟,地位高,建造的花亭才不受破坏。因此,花亭全面地反映了雄鸟的基因品质。”

贾雷德·戴蒙德并没有告诉我们,雌鸟是怎么知道这一切的。“数据” 告诉我们,雌鸟是 “知道” 的,对于绝大多数野外生物学家来说,这已经足够了,他们并不关心雌鸟是怎么知道的。他们也强调,其实不是雌鸟真知道,而是自然选择 “知道”,性选择的背后是自然选择在发挥作用。所以,他们说性选择是自然选择的附庸不无道理。但他们忘记了,在现场进行选择的确实是雌鸟,自然选择是怎么指挥雌鸟进行选择的?其中必须有一个选择机制,一个简单、实用、能够综合反映雄鸟素质的直觉判断。这个选择机制就是审美。

普鲁姆从达尔文的著作中,重新发现了被人遗忘的“阁楼上的疯女人”,敏锐地意识到,只有审美才是性选择唯一的驱动力。正如普鲁姆指出的,雌鸟并没有进行素质分析,在她眼里只有美感,因为自然选择已经把素质综合打包成了美感,埋藏在了她的内心。

长期以来,生物学家们可能被传统美学误导了,认为审美是人类特有的高级精神活动。所以,当达尔文在《人类的由来和性选择》中,以大眼斑雉为例,论述审美与性选择关系时提出,“经过雌性审美偏好一代又一代的选择,雄大眼斑雉变得越来越美丽,装饰性更强。而雌性的审美能力也不断强化和提升,就像我们自己的品味逐渐提升一样。” 大家误以为达尔文是在进行拟人化表述,殊不知,达尔文是在用科学语言进行严肃的科学表述。

对于达尔文来说,自从“自然选择” 这个词出现在他脑海中起,人类已经完全失去了万物之灵的中心地位。所以,正如许多进化生物学大家所指出的,虽然进化论提出已经150多年,但人们的思想转变和对达尔文遗产的继承还远没有完成。

罗纳德费希尔(费尔纳德斯) 第1张

试验设计的那些事——费希尔的试验逻辑

如果说数学史上最牛的父子关系,您可能会想到伯努利家族,伯努利家族一共产生了8名数学家,其中有三人是世界级的数学家。而在统计学中,也有史上最牛的翁婿关系,他们是罗纳德·费希尔(1890年-1962年)与乔治·博克斯(1919年—2013年),两位重量级的统计学家都为试验设计这一重要统计优化分支做出了突出的贡献。

然而,可能大多数人并不熟知,试验设计如此重要的优化方法居然诞生于一个叫洛桑的农业实验站——世界上最古老的农业研究站,而他的发明者就是统计学大师罗纳德·费希尔,他在其著作《研究工作者的统计方法》和《试验设计》等书籍中系统地介绍了他关于试验设计的精妙思想。

非常巧合的是,乔治·博克斯——罗纳德·费希尔的女婿,也衣钵了费希尔深邃的统计学思维,在试验设计、时间序列模型等领域钻深研精、大有所成,并且发表了大量重要的文章和著作,他有一句被统计学和大数据行业从业人员奉为经典的名言: 『 所有模型都是错误的,但有些是有用的 』 。博克斯在《演化式操作——一种过程改进的统计学方法》、《实验员的统计学》以及《经验建模和响应面法》等著作中系统地介绍了他对于试验设计的深刻理解,同时,他本人在帝国化学工业(ICI)实习和工作的八年时间里曾与他的同事(化学家和化学工程师们)研究探索了如何设计和分析试验以达到提升试验效率的目的,提出了如何更快速地寻找提升化学反应收率的系统性方法。

试验设计从最初应用于农业以提升亩产量,转而迅速普及推广到化学、医药、电子、机械等各行各业的生产和研发活动当中,这一过程中,各行各业的研究人员在实践中逐渐认识到了试验设计方法在优化范畴的独特优势,本文将系统地从为何试验设计?试验设计三大原则,试验设计的工作流程,为何部分因子试验?响应曲面及序贯试验策略,以及试验设计的应用场景等方面对试验设计做一个简要入门的介绍。

一、为何试验设计?——面搜索还是线搜索?

博克斯在其作品《统计学大师之路——乔治·博克斯回忆录》中曾提到, 『统计学是关于如何生成和使用数据来解决科学问题。为此,熟悉科学和科学方法至关重要。在科学和技术研究中,我们经常需要研究众多变量。不妨称那些你可以改变的变量为“输入变量”或“因子”,称那些你只能进行观测的变量为“输出变量”或“响应变量”。人们曾一度认为,研究多个因子影响的系统的正确方法是每次只改变一个因子。但早在八十多年前,R.A.费希尔就向世人揭示了,这种方法效率太低, 白白浪费了许多实验努力 。事实上,你应该按照所谓“实验设计”的安排同时改变多个因子。然而即便在现在,每次只改变一个因子的方法仍然在课堂上被教授。』

由此可见,即使在现在,仍有一些研究者依然在采用每次改变一个因子的方式( 也称之为COST,即 Change One Separate factor at a Time , 与之对应的 , 试验设计也称之为DOE , 即 Design of Experiments )来寻找最优值,然而,这种一次只改变一个因子的方式明显存在效率低下、因为无法评估交互效应而容易错失最优值等缺点。

我们可以先看一下如图1所示的案例:

某团队经过研究发现,其公司某种产品化学反应的收率与反应釜压力以及催化剂添加量有很大关系,为摸索最佳工艺展开如下试验:

1)固定催化剂添加量在5kg,调整反应釜压力进行试验数次,最后得出在反应釜压力750Mpa时,收率最佳;

2)随后,固定反应釜压力在750Mpa,调整催化剂添加量进行试验数次,最后得出催化剂添加量在3kg时,收率最佳;

3) 因此,研究团队认为反应釜要在750Mpa,催化剂添加量在3kg时,整体收率达到最佳。

那么,事实与这个团队得出的的结论相同吗?我们从右边通过试验设计获取的等高线图中可以明显地看出,最优点实际上发生在反应釜压力=650Mpa及催化剂添加量=3kg时,此时的收率将高于91%,而通过第一种方法得到的最佳收率估计在90%左右,由此可见,第一种方法确实存在错失最佳值的风险。实际上,从上图我们也可以看出,第一种方法实际上是一种线搜索的方式,而试验设计是一种面搜索的方式,很明显,通过面进行搜索比通过线进行搜索更高效,更容易捕捉到最佳值。同时,通过试验设计的方法,我们可以获得响应变量与因子之间非常直观的响应曲面和等高线图,可以帮助我们更好地理解响应变量随因子变化的规律。

二、试验设计的三大原则  ——费希尔的农田

通过以上第一节,我们明白了为什么DOE比COST方法更加高效,然而如何进行试验设计是一个非常重要的环节,这将直接关系到试验的效率和成败。费希尔在洛桑农业实验站工作的14年中(1919年-1933年),通过大量的试验研究总结出了试验设计的普适性的三大原则,即:

(1) 重复试验;

(2) 随机化;

(3) 区组化。

然而有时候,一些专业书籍对这三大原则的解读会非常晦涩难懂,这里我们通过一个杜撰的故事—— 费希尔的农田 ,尝试从另外一个视角来解读这三大原则。

如图2,故事讲的是,费希尔在洛桑农业实验站工作时,曾做过两种稻种亩产量的评估试验,他经过严密认真的思考,最终得出了试验设计的三大原则,并一直被学界奉为经典:

① 最初费希尔的想法是,在两块稻田中分别种上A稻种和B稻种,然后去看哪一种稻种的亩产量更高,这样就可以得出评估结论了;

② 可是,费希尔是大统计学家,所以稍作考虑后,认为仅仅从一个点去做判断是不严谨的,因此,他就把左右两块田各分成4块,然后再把A和B种上去,这样不仅可以得到A和B两种稻种亩产量的平均值,而且还可以获得它们亩产量的标准差,这样比较就更加有说服力了;

③ 但是,敏锐的费希尔很快又意识到上面的试验方法还是存在缺陷,因为根据自己多年在农业实验站工作的经验,实验站农田的土壤肥沃很是不均,假设左边的农田土壤一般,而右边的农田土壤更加肥沃,如果最后得出的结论是B稻种的产量更高,那么是稻种的原因导致其产量高,还是土壤的原因导致其产量高呢?这里就产生了两种因素的混淆,所以,他经过思考之后,又重新设计了试验方法,他在左边和右边的农田分别种上A和B,那么这样A和B稻种在土壤肥沃和普通的农田上都机会均等地种上了,所以这样做得出的结果会更加合理;

④ 本来这个试验方案可以直接来进行操作了,这时,农业实验站临时接到一个新任务,要求评价新发明的机械播种机比人工播种是否更有助于提高亩产量,为了减少试验次数,要求将两种评价合并在一起,费希尔不愧是天才,他很快就找到了完美的方法来解决这个问题,他把左边和右边的农田各一半用人工播种,另一半用机械播种,这样就在不增加试验次数的情况下,非常完美地完成了这个临时接到的任务。

实际上,费希尔在上面的试验逻辑思考②、③、④里面,已经非常完整地把重复试验、随机化和区组化这三大试验设计原则创造性地应用到两种稻种亩产量的评价任务中,从而,保证了试验结果的有效性和合理性,为最后得出科学的评价结果提供了有力保障。

当然,对于区组化,有一个基本原则,即: 『 能区组者则 分区组,不能分区组者则随机化。』

三、试验设计及分析的工作流程

以上我们已经知晓了试验设计的优越性以及试验设计的三大原则,这里我们通过一个全因子完全析因设计来介绍一下试验设计及分析的工作流程。

如图3,这是一个典型的 因子设计示意图,从图中可以看出,试验设计者试图研究A、B、C三个因子对响应变量的影响,为此,设计者设计了以下试验方案,并希望通过以上试验估计以下回归方程的系数:

由以上回归方程可以明显看出一共存在8个系数需要估计,因此,需要至少 次试验,类似地,如果因子数量为n个,那么我们需要做到完全析因,则需要至少 次试验。

根据前面所提到的试验设计的三大原则,我们还需要进行重复试验,但是为了减少试验次数,一般选择在中心点进行3-4次重复性试验。选择在中心点进行重复性试验还有一个好处,即它可以发现模型是否存在弯曲现象,如果存在弯曲现象,则我们需要加上因子的高阶项,以构成响应曲面,通常而言,也就意味着我们基本找寻到了最优值。当然,对于出现弯曲情况,还需要增加一些试验点来对模型参数进行估计,这将在后面进行讨论。同时,我们还需要对试验顺序进行随机化处理,本案例没有区组化的要求,因此,可以直接根据此试验设计进行试验,并获得相应的试验数据。

另外,在进行因子高低水平设置时,一定要尽可能地将高低水平设置得相对远一些,否则有可能试验中的噪声就可能淹没了本来存在的显著效应。而且,试验点设置远一些,也有助于探索未知的工艺位置,具体图4所示。

在获得了试验数据后,需要开始试验设计的分析工作,它基本上按照以下流程来展开:

实际上,以上工作流程中,前三个步骤我们在一元线性回归中已经进行了非常详细的介绍,稍有不同的是,在这个回归模型中,因子(主效应)的个数大于1个,且存在二阶交互项,所以,需要对回归系数进行检验,以确定其对响应变量的影响是否显著,同时,还需要看模型是否存在弯曲或者失拟的现象,比如,我们从模型结果中看到某个主效应不显著,或者某个二阶交互效应不显著的话,我们需要将这些项剔除后,重新进行回归。

当模型经过改进已经不存在任何异常时,就可以进入了模型解释阶段,在此阶段,我们需要做两件事情:

(1)通过输出因子的主效应图、交互效应图来进一步验证和确认它们的显著性;

(2) 通过输出等高线图、响应曲面来更加直观地理解响应变量随自变量变化的规律,以帮助寻找最佳设置。

接下来,我们还需要通过响应优化器来寻找最佳设置,并且判断最优值是否已经达到了原先设定的目标,如果已经达到了,并不代表工作就结束了,而是需要做进一步的验证试验,通常的做法是在最佳点做3次以上验证试验,当然,如果还没有达到原先设定的目标,则我们还需要以最佳点为中心继续安排试验设计,直至达到预定的目标为止。

四、为何部分因子试验?——分辨度与试验效率间的平衡

前面已经提到,当因子数量为n时,如果需要做完全析因设计,则至少要做 次试验,简单的计算我们就可以得到,当因子数量达到5个时,完全析因设计就需要32次试验(不包含中心点),当因子数量达到6个时,完全析因设计就需要64次试验。以4个因子为例,我们给出试验设计的模型方程如下:

由此可以看出,如果做完全析因设计,除了常数项外,估计出来的主效应有4项,二阶交互效应项共6项,三阶交互效应项共4项,四阶交互效应项共1项,一共 项,而这些项中,三阶及三阶以上的交互项实际上已经不具备现实意义了,因此,我们真正需要推断的参数仅有常数项、主效应项和二阶交互效应项,一共是11项,因此,希望少做实验,同时能对模型方程中的常数、一阶及二阶项系数的想法是有可能实现的。

现实工作中,由于资源和时间的限制,这种对效率和试验成本控制的需求是常见的。依然以4因子(A、B、C、D)为例,完全析因设计需要16次试验,而此时根据限制条件,只能做8次试验,那么如何去选择这8次试验是最合理的呢?根据分析可以得出,按照 生成元D=ABC(定义关系为ABCD= 1 , 简称 “字”) 来选择试验是最合理,这样不仅可以保证实验设计的正交性,同时,可以保证一阶主效应与二阶交互效应不产生混杂。

在部分因子试验中,也存在多个生成元(即多个字)的情况,此时,将所有字中长度最短的那个字的长度定义为整个设计的分辨度(resolution),分辨度通常用罗马数字给出,如I、II、III、IV等。前面的例子通过ABCD=1来获得8次试验安排,那么它的分辨度就是IV,这个设计方案就记为 ,更一般地,分辨度为R的部分因子设计记为 ,其中k为因子个数,而p为生成元或字的个数。

统计学家为了方便研究者使用方便,特地编制了表2的部分因子试验分辨度表,同时,在minitab或者jmp软件中,也可以通过软件直接生成部分因子试验的设计。

由以上表格可以看出,在因子数量确定的情况下,我们需要得到更高的分辨度,那么就必须要做更多的试验,所以,在实际工作中,研究者可以根据自身的需求来进行选择,使得分辨度和效率达到一种均衡。

五、响应曲面方法及序贯试验策略——弯曲下的选择

响应曲面方法(ResponseSurface Method,RSM)一般适用于以下情形:

(1) 因子数量较少(通常不超过3个)的情形;

(2) 需要求出响应变量最大值或最小值。

在试验设计中,响应曲面方法一般发生在筛选因子后进行全因子试验时发现有弯曲的现象的情况下,此时,需要采取的策略是在模型中加入含二次项的回归方程,以2水平为例,其一般模型可以表示为:

很明显,此时需要估计的参数增加了2个(因子的平方项的系数),那么原先的试验点就不够用了,需要增加一些试验点,再通过线性回归的方式来估计相关参数。而此时,最高效的方式就是采用序贯试验策略来增加试验点,图6显示了2种保持序贯性的中心复合设计方法。当然,在响应曲面设计还包括其它类型的方法,但是它们都不具备保持序贯性的特点,如中心复合有界设计(CCI)和Box-Behnken设计。

在增补了试验点后,就可以进行响应曲面分析了,其分析流程与前述的试验设计分析流程基本类似,这里就不再赘述。

六、试验设计在工业现场的应用场景介绍

试验设计作为一种高效的优化工具在各个行业得到广泛应用,尤其是在化工行业,研究者通过试验设计方法来提升产品配方设计与开发效率、改善生产效率、提高产品收率等等,此外,通过试验设计来提升产品的可靠性、过程的鲁棒性已经在很多行业获得了巨大的成功。

在进行试验设计中,统计思考以及研究人员的专业知识和经验(非统计知识)对于试验的成功是非常重要的。然而在做一些探索性的研究时,由于积累的知识和经验较少,需要评估的因子数量将会陡然增多,从前面讨论中可知,当因子数量变多时,完全析因设计的试验次数将呈现指数级的增长,即便是部分因子试验,试验次数依然非常之多,因此,对企业而言,将造成了较大的研发成本压力,并且影响了研发效率。国工智能在与国内万华研究院的合作项目中,国工智能的数据科学专家通过贝叶斯优化算法使得原先需要150次试验才可以完成的优化工作,降低到仅仅3个轮组共15次的试验就达到了同样的效果,然而不可否认的是,试验设计方法与机器学习算法相比,其模型的可解释性更强,这对于研究人员进行进一步的机理研究是至关重要的,同时,即便是人工智能算法,也需要前期试验设计所获得数据点的支持以做进一步的优化和实验安排。

总体而言,试验设计目前依然是化工和医药领域最为重要的一种优化工具。作为化工和医药领域人工智能决策控制领域的领跑者,国工智能一直非常重视各种统计学模型算法的开发和应用,目前其数据大脑平台已经融合了上百种统计学和机器学习算法,并在化工、医药等行业得到了广泛的应用,为国内众多企业创造了巨大的商业价值。

参考文献:

[1].《统计学》,[美]William M. Mendenhall等著

[2].《Design and Analysis of Experiments》,[美]Douglas C. Montgomery著

[3].《统计学大师之路——乔治·博克斯回忆录》,[英]George E.P. Box著

[4].《六西格玛管理统计指南》,马逢时等著

[5]. A Brief Introduction to Design of Experiments, [美] Jacqueline K. Telford.

极大似然估计法的步骤

极大似然估计法的步骤:

写出极大似然函数的表达式。

极大似然函数是未知变量X的所有可能结果的概率的乘积。

求出极大似然函数的对数的表达式并化简整理。

由于极大似然函数的表达式是多项的乘积的形式,对关于未知参数求导(梯度)十分复杂,而求其对数之后,不仅没有改变原来的变化趋势,而且求导更加容易。

未知参数的极大似然估计,是使对数极大似然函数最大的值,如下面第一个图所示,简单来讲,就是求对数极大似然函数关于未知参数的导数为0的解。

极大似然估计方法(Maximum Likelihood Estimate,MLE)也称为最大概似估计或最大似然估计,是求估计的另一种方法,最大概似是1821年首先由德国数学家高斯(C. F. Gauss)提出,但是这个方法通常被归功于英国的统计学家。罗纳德·费希尔(R. A. Fisher)

极大似然估计,只是一种概率论在统计学的应用,它是参数估计的方法之一。说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。极大似然估计是建立在这样的思想上:已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。

当然极大似然估计只是一种粗略的数学期望,要知道它的误差大小还要做区间估计。

免责声明
本站所有信息均来自互联网搜集
1.与产品相关信息的真实性准确性均由发布单位及个人负责,
2.拒绝任何人以任何形式在本站发表与中华人民共和国法律相抵触的言论
3.请大家仔细辨认!并不代表本站观点,本站对此不承担任何相关法律责任!
4.如果发现本网站有任何文章侵犯你的权益,请立刻联系本站站长[QQ:593501529],通知给予删除

相关推荐