自动数据清洗 8H可以洗200万条数据的贝叶斯“数据清洗”机器人

自动数据清洗 - 国内版 Bing
https://cn.bing.com/search?q=自动数据清洗&qs=n&form=QBRE&sp=-1&pq=自动数据清洗&sc=0-6&sk=&cvid=A26B28B818554D5FA7911AB06E4EDC4E

8H可以洗200万条数据的贝叶斯“数据清洗”机器人_腾讯新闻
https://new.qq.com/omn/20210608/20210608A095PQ00.html

PClean: A probabilistic scripting DSL // Bodacious Blog
https://mullikine.github.io/posts/pclean-gen-gpl/

GitHub - probcomp/PClean: A domain-specific probabilistic programming language for scalable Bayesian data cleaning
https://github.com/probcomp/PClean

(1条消息) Waterdrop帮你快速玩转Spark数据处理_首席撩妹指导官的博客-CSDN博客
https://blog.csdn.net/qq_36864672/article/details/81010704

Waterdrop推动Spark Structured Streaming 走向生产环境 - 知乎
https://zhuanlan.zhihu.com/p/62515126

GitHub - InterestingLab/waterdrop: 生产环境的海量数据计算产品,文档地址:
https://github.com/InterestingLab/waterdrop

号称中国的splunk-日志易公司怎么样? - 算法 - Algorithm - 水木社区
http://cncc.bingj.com/cache.aspx?q=销售易+Spark&d=4918081364495785&mkt=en-US&setlang=en-US&w=njnpAFgmbWW8fCaff0dkW6PkR6UEAl-p

原文地址:https://www.cnblogs.com/rgqancy/p/14866340.html