题C:数据的财富

  在其创建的在线市场中,亚马逊为客户提供了对购买进行评分和评价的机会。个人评级-称为“星级”-使购买者可以使用1(低评级,低满意度)到5(高评级,高满意度)的等级来表示他们对产品的满意度。此外,客户可以提交基于文本的消息(称为“评论”),以表达有关该产品的更多意见和信息。其他客户可以根据这些评论提交有帮助或无帮助的等级(称为“帮助等级”),以协助他们自己的产品购买决策。公司使用这些数据来深入了解其参与的市场,参与的时间以及产品设计功能选择的潜在成功。

  阳光公司计划在在线市场上推出和销售三种新产品:微波炉,婴儿奶嘴和吹风机。他们已聘请您的团队担任顾问,以识别过去客户提供的与其他竞争产品相关的评分和评论的关键模式,关系,度量和参数,以:1)告知其在线销售策略;2)识别潜在重要的设计特征,以提高产品的吸引力。Sunshine Company过去曾使用数据为销售策略提供信息,但他们以前从未使用过这种特殊的组合和数据类型。Sunshine Company特别感兴趣的是这些数据中的基于时间的模式,以及它们是否以有助于该公司制造成功产品的方式进行交互。

  为了帮助您,Sunshine的数据中心为您提供了该项目的三个数据文件:hair_dryer.tsv,microwave.tsv和pacifier.tsv。这些数据代表在数据指示的时间段内在亚马逊市场上出售的微波炉,婴儿奶嘴和吹风机的客户提供的评分和评论。还提供了数据标签定义的词汇表。提供的数据文件包含您应用于此问题的唯一数据。

要求

  1. 分析提供的三个产品数据集,以鉴定,描述和支持数学证据,有意义的定量和/或定性模式,关系,测度和参数,这些数据将在星级,评论和帮助等级之内和之间进行,这将有助于阳光公司取得成功他们的三个新的在线市场产品。

  2. 使用您的分析解决Sunshine Company市场总监的以下特定问题和要求:

   a. 一旦三种产品在在线市场上出售后,就可以根据评级和评论确定最能为Sunshine Company跟踪的数据度量。

  b. 在每个数据集中识别并讨论基于时间的度量和模式,这些度量和模式可能表明产品的声誉在在线市场中正在增加或减少。

  c. 确定最能表明潜在成功或失败产品的基于文本的度量和基于评级的度量的组合。

  d. 特定星级会引起更多评论吗?例如,在看到一系列低星级评级之后,客户是否更有可能撰写某种类型的评论?

  e. 基于文本的评论(例如“热情”,“失望”等)的特定质量描述符是否与评分水平紧密相关?

  1. 写一两页给阳光公司市场总监的信,总结您团队的分析和结果。包括针对您的团队最有信心地推荐给市场总监的结果的具体理由。

您提交的内容应包括:

  • 一页摘要表
  • 目录
  • 一页至两页的信函
  • 您的解决方案不超过20页,最多包含摘要页,目录和两页信函的24页。

Github:https://github.com/ITJoker233/Mathematical_modeling.git