立即获取 100% 谷歌专业数据工程师考试真题及答案 [Q44-Q64]

给本帖评分

立即获取 100% 真实的 Google 专业数据工程师考试问题及经过验证的答案

用于准备最新专业数据工程师考试问题的考试题库

问题 44
您的神经网络模型需要数天才能完成训练。您想提高训练速度。您能做些什么?

 
 
 
 

问题 45
其中哪些是稀疏向量中值的示例?(请选择 2 个答案)。

 
 
 
 

问题 46
您经营着一家物流公司,希望提高车载传感器的事件交付可靠性。您在世界各地运营着小型数据中心来捕捉这些事件,但从您的事件收集基础设施到事件处理基础设施之间提供连接的租用线路并不可靠,存在不可预测的延迟。您希望以最具成本效益的方式解决这一问题。您该怎么办?

 
 
 
 

问题 47
您正在开展一个涉及用户私人数据的敏感项目。您在 Google 云平台上建立了一个项目,用于在内部开展工作。一名外部顾问将协助您在谷歌云数据流管道中为您的项目编码一个复杂的转换。您应该如何维护用户隐私?

 
 
 
 

问题 48
您的神经网络模型需要数天才能完成训练。您想提高训练速度。您能做些什么?

 
 
 
 

问题 49
您正在管理 Cloud Dataproc 集群。您需要在不丢失集群上正在进行的工作的情况下,加快作业的运行速度,同时尽量降低成本。您应该怎么做?

 
 
 
 

问题 50
您正在部署 10,000 台新的物联网设备,以收集全球仓库的温度数据。您需要实时处理、存储和分析这些庞大的数据集。
你该怎么办?

 
 
 
 

问题 51
您正在设计一个云原生历史数据处理系统,以满足以下条件:
* 所分析的数据为 CSV、Avro 和 PDF 格式,可通过多种分析工具访问,包括 Cloud Dataproc、BigQuery 和 Compute Engine。
* 流式数据管道每天都会存储新数据。
* 性能不是解决方案中的一个因素。
* 解决方案的设计应最大限度地提高可用性。
如何为该解决方案设计数据存储?

 
 
 
 

问题 52
贵公司建立了一个具有大量神经元和层的 TensorFlow 中性网络模型。该模型与训练数据拟合良好。但是,在对新数据进行测试时,它的表现却很差。您可以采用什么方法来解决这个问题?

 
 
 
 

问题 53
您在一家经济咨询公司工作,该公司帮助企业识别经济发展趋势。作为分析工作的一部分,您使用 Google BigQuery 将客户数据与面包、汽油、牛奶等 100 种最常见销售商品的平均价格关联起来。这些商品的平均价格每 30 分钟更新一次。您希望确保这些数据保持最新,以便以尽可能低的成本将其与 BigQuery 中的其他数据结合起来。您应该怎么做?

 
 
 
 

问题 54
关于 Bigtable 访问角色,以下哪些说法不正确?

 
 
 
 

问题 55
您需要在六个月内将 2 PB 的历史数据从内部部署的存储设备迁移到 Cloud Storage,而您的出站网络容量被限制在 20 Mb/秒。应该如何将这些数据迁移到云存储?

 
 
 
 

问题 56
您可以使用哪个 Java SDK 类在本地运行 Dataflow 程序?

 
 
 
 

问题 57
您开发了三个数据处理作业。其中一个执行云数据流管道,转换上传到云存储的数据并将结果写入 BigQuery。第二个任务从内部服务器摄取数据并将其上传到云存储。第三个是云数据流管道,从第三方数据提供商获取信息并将信息上传到云存储。您需要能够安排和监控这三个工作流的执行,并在需要时手动执行它们。您应该怎么做?

 
 
 
 

问题 58
关于 BigQuery 缓存,哪些说法是正确的?

 
 
 
 

问题 59
您负责编写公司的 ETL 管道,以便在 Apache Hadoop 集群上运行。您需要
管道将需要一些检查点和拆分管道。您应该使用哪种方法来编写
管道?

 
 
 
 

问题 60
为什么需要将机器学习数据集分为训练数据和测试数据?

 
 
 
 

问题 61
如何让神经网络了解分类特征中不同类别之间的关系?

 
 
 
 

问题 62
如果您正在运行一个依赖于 Cloud Bigtable 的性能测试,那么除以下选项外,所有选项都是推荐步骤。哪个不是推荐步骤?

 
 
 
 

问题 63
MJTelco 案例研究
公司概况
MJTelco 是一家初创公司,计划在全球快速增长、服务不足的市场建立网络。该公司拥有创新光通信硬件的专利。基于这些专利,他们可以用廉价的硬件创建许多可靠的高速主干链路。
公司背景
MJTelco 由经验丰富的电信高管创立,采用的技术最初是为克服太空通信挑战而开发的。作为运营的基础,他们需要创建一个分布式数据基础设施,以推动实时分析并结合机器学习来不断优化拓扑结构。由于硬件成本低廉,他们计划超量部署网络,以便考虑到动态区域政治对位置可用性和成本的影响。
他们的管理和运营团队遍布全球各地,在数据消费者和系统提供者之间形成了多对多的关系。经过慎重考虑,他们认为公共云是支持其需求的完美环境。
解决方案理念
MJTelco 正在其实验室成功实施一个概念验证 (PoC) 项目。他们有两个主要需求:
* 扩展和加固其 PoC,以支持在数据流量增加到超过 100 万亿次时产生的更多数据流。
50,000 次安装。
* 完善机器学习循环,验证并改进用于控制拓扑定义的动态模型。
MJTelco 还将使用开发/测试、暂存和生产三个独立的运行环境,以满足运行实验、部署新功能和服务生产客户的需要。
业务要求
* 在不可预测的分布式电信用户社区中,以最小的成本扩展生产环境,在需要的时间和地点配置资源。
* 确保其专有数据的安全,以保护其领先的机器学习和分析。
* 为分布在各地的研究人员提供可靠、及时的数据分析途径
* 维护隔离环境,支持机器学习模型的快速迭代,同时不影响客户。
技术要求
* 确保安全有效地传输和存储遥测数据
* 快速扩展实例,支持 10,000 到 100,000 个数据提供商,每个提供商可提供多个数据流。
* 允许根据数据表进行分析和演示,最多可跟踪约 2 年的数据存储
100 米记录/天
* 支持监测基础设施的快速迭代,重点关注遥测流和生产学习周期中的数据管道问题。
首席执行官声明
我们的商业模式依赖于我们的专利、分析和动态机器学习。我们的硬件价格低廉,可靠性高,因此具有成本优势。我们需要快速稳定我们的大型分布式数据管道,以实现我们的可靠性和容量承诺。
首席技术官声明
我们的公共云服务必须按照广告宣传的那样运行。我们需要能够扩展并确保数据安全的资源。
我们还需要数据科学家能够仔细研究并快速调整模型的环境。
由于我们依靠自动化来处理数据,因此我们还需要我们的开发和测试环境能够在迭代过程中正常工作。
首席财务官声明
该项目规模太大,我们无力维护数据和分析所需的硬件和软件。此外,我们也无力为监控如此多的数据源配备运营团队,因此我们将依赖自动化和基础设施。谷歌云的机器学习将使我们的定量研究人员能够解决我们的高价值问题,而不是数据管道问题。
MJTelco 需要您在 Google Bigtable 中创建一个模式,以便对过去两年的记录进行历史分析。每条记录每 15 分钟发送一次,其中包含设备的唯一标识符和数据记录。最常见的查询是查询给定设备在给定一天内的所有数据。您应该使用哪种模式?

 
 
 
 
 

问题 64
您正在开发一个在 Google 云上使用推荐引擎的应用程序。您的解决方案
应根据过去的观看情况向客户显示新视频。您的解决方案需要为以下内容生成标签
客户观看过的视频中的实体。您的设计必须能够提供非常快速的过滤功能
根据几个 TB 数据中其他客户的偏好数据提出建议。您应该怎么做?

 
 
 
 

下载最新有效的 Google Professional-Data-Engineer 考试试题: https://www.passtestking.com/Google/Professional-Data-Engineer-practice-exam-dumps.html

管理

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

输入下图中的文字
 

发表评论

zh_TWChinese