职位信息
新西兰惠灵顿维多利亚大学数学与统计学院招收基于模型的混合类型数据聚类统计学和数据科学全奖博士。
项目介绍:
这项博士奖学金由新西兰皇家学会Marsden Fast-Start项目资助。成功申请者将由维多利亚大学的 Louise McMillan 博士和奥克兰大学 Waipapa Taumata Rau 生物科学学院 - Te Kura Mātauranga Koiora 的 Emma Carroll 博士指导。
聚类是许多应用中使用的一种技术,但很少有方法可用于聚类分类数据或分类数据和数值数据的混合,而不是简单地假装分类数据是数值的。该项目旨在为包含大量分类变量的大型数据集开发无监督聚类方法。无监督方法不需要预先标记的训练数据,因此即使数据结构未知也可以使用。
该项目将探索两种不同的方法,一种基于贝叶斯遗传聚类方法,另一种则完全新颖,适用于具有大量相关变量的情况。该项目的主要重点是开发新方法和配套的 R 包,以便其他人使用该方法。
新方法的初始案例研究将是动物保护遗传学,使用卡罗尔博士国际合作的现有遗传数据集。然而,开发的算法将在众多研究领域和行业中具有潜在应用,包括医学调查和商业营销。
导师介绍:
Dr Louise McMillan
我于 2019 年完成了统计学博士学位,然后以博士后研究员的身份加入 VUW,之后被任命为讲师。我的研究领域是动物种群遗传学的统计方法以及基于模型的分类和混合数据聚类。我与 Ivy Liu 和 Richard Arnold 密切合作,研究基于模型的聚类。
我目前的研究主要是基于模型的分类数据或混合数据类型的聚类。我与 Ivy Liu、Richard Arnold、Shirley Pledger 和 Daniel Fernández 合作,我们工作中产生的一个核心 R 软件包可在
https://github.com/vuw-clustering/clustord 上找到。
我的博士研究方向是统计生态学,特别是种群遗传学。我开发了可视化遗传分配数据和种群分化的新技术。这些方法可应用于任何二倍体物种,但我的重点是应用于濒危物种保护和入侵害虫物种管理。我的遗传数据可视化 R 软件包可在
https://github.com/lfmcmillan/geneplot 上找到。
申请要求:
我们正在寻找一位积极进取的人,他拥有优秀的学术记录、良好的统计学理解能力,并有兴趣为与聚类和混合类型数据相关的前沿研究做出贡献。
- 国际或国内学生均可申请。
- 申请人必须已获得统计学或数据科学硕士学位(或荣誉学位)
- 申请人的 GPA 最低为 3.0(满分 4.0)。
- 申请者必须满足 VUW 博士学位的标准入学要求,包括英语语言能力。
- 雅思 6.5,单项成绩不低于 6。或
- 托福90 分,其中写作最低分数为 21 分
- 申请人必须精通 R 编程语言。
除了统计学和 R 知识外,至少在以下领域之一拥有经验也会非常有益:
- 聚类,尤其是基于模型的聚类
- 遗传学
- 算法/方法开发
- R 包开发
- 模拟和建模
奖学金:
为期三年、每年 35,000 美元的津贴将按月直接支付给学生。学费和税费将直接支付给大学。
学生必须每 6 个月完成一次博士学习进度报告,并达到令人满意的标准。
接受该奖学金的条件与惠灵顿博士奖学金类似(与决策者有关的条件除外)。
热门跟贴