Microsoft邀请Visual Studio Code用户浸入Azure Data Lake
Microsoft正在将生命线延伸到可能淹没在公司Azure云计算平台上存储的大数据中的开发人员和数据科学家。该公司添加了允许Visual Studio Code(VSCode)用户浏览和管理驻留在Azure Data Lake Store帐户中的文件和数据对象以及浏览Data Lake Analytics元数据的集成。
顾名思义,Azure Data Lake Store使用户能够在与Apache HDFS(Hadoop分布式文件系统)兼容的大数据存储服务上存储数万亿个对象,包括PB级文件。同时,Azure Data Lake Analytics是一项Apache YARN(但又是资源协商者)服务,可进行大规模分析。
现在,借助新的Azure数据湖(ADL)集成,需要管理那些服务中的信息的开发人员可以在ADL Tools for Visual Studio Code中使用数据湖资源管理器,以更好,更快地掌握其基于云的大数据环境。Visual Studio Code是Microsoft的轻量级跨平台代码编辑器。
微软大数据小组的首席项目经理詹妮·江在1月3日的博客中解释说,该工具包通过自动登录功能简化了Azure登录体验,从而缩短了访问相关Azure云服务所需的时间。
江补充道,Data Lake Explorer用户还可以在使用U-SQL时以树状层次结构的方式检查Azure Data Lake Analytics元数据,以及创建和删除U-SQL数据库对象。受Microsoft自己的大数据系统分布式运行时的启发,U-SQL是一种查询语言,旨在帮助.NET和SQL开发人员快速掌握大数据应用程序的速度。
同样,Data Lake Explorer用户现在可以深入研究Azure Data Lake Store,从而无需离开Visual Studio代码就可以预览,下载和删除文件。为了帮助保持工作空间整洁,新命令(ADL:Set Git Ignore)允许用户从其GitHub存储库中排除系统生成的文件和文件夹。
Microsoft Azure 博客中提供了最新的适用于Visual Studio Code的Azure Data Lake Tools的安装说明以及相关文档和教程的链接。
微软并不是第一次尝试让客户更容易地访问基于云的大数据产品。
在11月,云提供商推出了新的仪表板体验,并提高了对Azure Data Lake Analytics帐户利用率和成本模式的可见性。新界面的标题是类似于Power BI的可视化,显示了使用的分析单位工时(按需付费客户无法使用的功能),任何超额费用以及使用该服务的估计成本。分析单元是对使用的Azure Data Lake计算资源的一种度量。
更新后的仪表板还提供了Azure Data Lake Analytics活动的快照,包括当前正在运行,排队或正在筹备中的作业数量,以及作业提交者的数量。最后,一览表使用户能够快速确定其帐户是否具有足够的AU来运行作业。