设计用于提高医疗保健 物联网的数据库性能的系统

科技2020-08-21 19:40:05
导读有时最好是更聪明而不是更努力地工作。在达到数据库的最佳性能时也是如此。无论是用于医疗保健,物联网还是其他数据密集型应用程序,使

有时最好是更聪明而不是更努力地工作。在达到数据库的最佳性能时也是如此。

无论是用于医疗保健,物联网还是其他数据密集型应用程序,使用数据库的最大挑战之一是更高的速度以更高的运营成本为代价,从而导致数据中心的超额配置以实现高数据可用性和可用性。数据库性能。

随着数据量的增加,数据库可能会将诸如读取和写入之类的工作负载排队,并且无法产生稳定且可预测的性能,这对于智能城市或军方的关键自主系统而言可能是一个大难题。

普渡大学的计算机科学家团队创建了一个名为SOPHIA的系统,该系统旨在帮助用户重新配置数据库,以实现随时间变化的工作负载实现最佳性能,并支持从宏基因组学到高性能计算(HPC)到物联网的各种应用,吞吐量,弹性数据库至关重要。

美国国立卫生研究院通过NIH-R01资助为某些研究提供了支持。

普渡大学农业与生物工程学助理教授索马里·查特尔吉(Somali Chaterji)说:“在涉及数据库时,您必须三思而后行。”他指导细胞与神经机器创新(ICAN)并领导了这篇论文。

Purdue的SOPHIA系统包含三个组件:工作量预测器,成本效益分析器和分散式重新配置协议,该协议了解组织的数据可用性要求。

普渡大学电气与计算机工程学教授Saurabh Bagchi说:“我们的三个组件共同工作,以了解数据库的工作量,然后进行成本效益分析,以应对动态工作量不断变化的情况,从而实现最佳性能。”计算机科学(由礼貌提供)。“然后,最终组件将利用所有这些信息来确定重新配置数据库参数以实现最大成功的最佳时间。”

普渡大学的团队使用Cassandra和Redis这两个著名的noSQL数据库对该技术进行了基准测试,这是一类主要的数据库,被广泛用于支持社交网络和音频流视频内容等应用领域。

查特吉说:“ Redis是一类特殊的noSQL数据库,因为它是内存中的键值数据结构存储,尽管它具有硬盘持久性。” “因此,使用Redis,SOPHIA可以用作恢复Redis弃用的虚拟内存功能的一种方法,该功能将允许数据量大于计算机RAM的数据量。”

该项目的首席开发人员是Ashraf Mahgoub博士。计算机科学专业的学生。今年夏天,他将回去Microsoft Research实习,当今年秋天返回时,他将继续致力于针对云托管数据库的更多优化技术。

普渡大学团队的测试表明,与默认数据库配置和静态优化数据库配置相比,SOPHIA取得了显着收益。即使在预测确切的工作特征方面存在很大的不确定性时,这种好处仍然存在。

这项工作还表明,Cassandra可以优先于最近流行的嵌入式ScyllaDB(一种自动调整数据库)使用,只要覆盖诸如SOPHIA之类的动态调谐器,它就可以在整个工作负载类型范围内提供更高的吞吐量。在卡桑德拉(Cassandra)上。

SOPHIA已通过MG-RAST(一种用于微生物组数据的宏基因组学平台)进行了测试;高性能计算工作负载;以及数字农业和自动驾驶汽车的物联网工作负载。

免责声明:本文由用户上传,如有侵权请联系删除!