2020 MCM Problem C Translation,2020美赛C题翻译

2020 MCM Problem C Translation,2020美赛C题翻译

在其创建的在线市场中,亚马逊为客户提供了对购买进行评分和评价的机会。个人评级-称为“星级”-使购买者可以使用1(低评级,低满意度)到5(高评级,高满意度)的等级来表示他们对产品的满意度。此外,客户可以提交基于文本的消息(称为“评论”),以表达有关产品的更多意见和信息。其他客户可以在这些评论中提交有帮助或无帮助的评分(称为“帮助评分”),以协助他们自己的产品购买决策。公司使用这些数据来深入了解其参与的市场参与的时间以及产品设计功能选择的潜在成功。

阳光公司计划在在线市场上推出和销售三种新产品:微波炉,婴儿奶嘴和吹风机.他们已聘请您的团队作为顾问,以识别过去客户提供的与其他竞争产品相关的评分和评论的关键模式,关系,度量和参数,来:1)告知其在线销售策略; 2)确定潜在的重要设计特征,以提高产品的吸引力。Sunshine Company过去曾使用数据为销售策略提供信息,但他们以前从未使用过这种特殊的组合和数据类型。Sunshine Company特别感兴趣的是这些数据中的基于时间的模式,以及它们是否以有助于该公司制造成功产品的方式进行交互。

为了帮助您,Sunshine的数据中心为您提供了该项目的三个数据文件:hair_dryer.tsv,microwave.tsv和pacifier.tsv。这些数据代表在数据指示的时间段内在Amazon市场上出售的微波炉,婴儿奶嘴和吹风机的客户提供的评分和评论。还提供了数据标签定义的词汇表。提供的数据文件包含您应用于此问题的唯一数据。

要求

  • 1.分析提供的三个产品数据集,以使用数学证据来识别,描述和支持有意义的定量和/或定性模式,关系,量度和参数,这些数据将在有助于评估阳光公司的星级,评论和帮助等级之内和之间在三个新的在线市场产品中都取得了成功。

  • 2.使用您的分析解决阳光公司市场总监的以下特定问题和要求:

    • a. 一旦三种产品在在线市场上出售后,根据评级和评论来识别数据度量,这对于Sunshine Company最为有用。
    • b. 在每个数据集中识别并讨论基于时间的度量和模式,这些度量和模式可能表明产品在在线市场中的声誉在上升或下降。
    • c. 确定最能表明潜在成功或失败产品的基于文本的度量和基于评级的度量的组合。
    • d. 特定的星级评级是否会引发更多的评论?例如,在看到一系列的低星级评价后,客户更有可能写一些评论吗?
    • e. 基于文本的评论的特定质量描述符,如“热情”、“失望”等,是否与评级水平密切相关?
  • 3.写一两页的信给阳光公司的市场总监,总结您团队的分析和结果。包括针对您的团队最有信心地推荐给市场总监的结果的具体理由。

    你所提交的应包括:

    • 一页摘要页
    • 目录
    • 一至两页的信件
    • 你的解决方案不超过20页,最多24页,包括你的摘要表、目录和两页的信。

Glossary 词汇表

  • Helpfulness Rating: an indication of how valuable a particular product review is when making a decision whether or not to purchase that product…
    帮助等级:表示在决定是否购买该产品时特定产品评论的价值。
  • Pacifier: a rubber or plastic soothing device, often nipple shaped, given to a baby to suck or bite on.
    奶嘴:一种橡胶或塑料的舒缓装置,通常为乳头状,提供给婴儿吸吮或咬咬。
  • Review: a written evaluation of a product.
    审查:对产品的书面评估。
  • Star Rating: a score given in a system that allows people to rate a product with a number of stars.
    星级:在系统中给出的分数,该分数使人们可以对具有多个星级的产品进行评分。

Attachments 附件:问题数据集

Problem_C_Data.zip提供的三个数据集包含产品用户评分和通过Amazon Simple Storage Service(Amazon S3)从Amazon客户评论数据集提取的评论。 hair_dryer.tsv微波.tsv pacifier.tsv数据集定义:每行代表划分为以下各列的数据。

● marketplace (string): 2 letter country code of the marketplace where the review was written.
市场(字符串):撰写评论的市场的2个字母的国家代码。

● customer_id (string): Random identifier that can be used to aggregate reviews written by a single author.
customer_id(字符串):随机标识符,可用于汇总单个作者撰写的评论。

● review_id (string): The unique ID of the review.
review_id(字符串):评论的唯一ID。

● product_id (string): The unique Product ID the review pertains to.
product_id(字符串):审核所属的唯一产品ID。

● product_parent (string): Random identifier that can be used to aggregate reviews for the same product.
product_parent(字符串):随机标识符,可用于汇总同一产品的评论。

● product_title (string): Title of the product.
product_title(字符串):产品的标题。

● product_category (string): The major consumer category for the product.
product_category(字符串):产品的主要消费者类别。

● star_rating (int): The 1-5 star rating of the review.
●star_rating(int):评论的1-5星评级。

● helpful_votes (int): Number of helpful votes.
helpful_votes(int):有用的投票数。

● total_votes (int): Number of total votes the review received.
total_votes(int):评论收到的总票数。

● vine (string): Customers are invited to become Amazon Vine Voices based on the trust that they have earned in the Amazon community for writing accurate and insightful reviews. Amazon provides Amazon Vine members with free copies of products that have been submitted to the program by vendors. Amazon doesn’t influence the opinions of Amazon Vine members, nor do they modify or edit reviews.
vine(字符串):基于客户在撰写准确而有见地的评论方面所获得的信任,邀请客户成为Amazon Vine Voices。亚马逊为Amazon Vine成员提供了供应商已提交给该程序的产品的免费副本。Amazon不会影响Amazon Vine成员的意见,也不会修改或编辑评论。

● verified_purchase (string): A “Y” indicates Amazon verified that the person writing the review purchased the product at Amazon and didn’t receive the product at a deep discount.
verify_purchase(字符串):“ Y”表示亚马逊已验证撰写评论的人在亚马逊上购买了该产品,并且没有以大幅折扣收到该产品。

● review_headline (string): The title of the review.
review_headline(字符串):评论的标题。

● review_body (string): The review text.
review_body(字符串):评论文本。

● review_date (bigint): The date the review was written.
review_date(bigint):撰写评论的日期。

原文地址:https://www.cnblogs.com/pailang-lee/p/14347591.html