翠花可在?可否进来讨论。】
李翠花:啥事儿?新人新号。
天问:我今天正在处理工作上的问题,你对高维稀疏数据的处理怎么看?
李翠花:我建议可以结合PCA主成分分析和t-SNE进行降维,然后再用XGBoost或LightGBM进行特征重要性评估,这样既能保留关键信息,又能减少计算复杂度。
天问:PCA对非线性关系的捕捉能力有限,是不是可以考虑UMAP?它在处理非线性数据时表现更好,而且计算效率也比t-SNE高。
李翠花:UMAP确实是个好选择,尤其是它的局部结构保留能力。不过我觉得需要先对数据进行标准化处理,否则UMAP的效果可能会打折扣。另外,我建议在降维后加入聚类分析,比如K-means或DBSCAN,看看能不能发现一些潜在的模式。
天问:关于模型部署的部分你怎么看?ONNX格式怎么样?它可以让模型在不同的框架之间无缝切换,比如从PyTorch到TensorFlow
李翠花:ONNX确实是个好工具,尤其是在跨平台部署时。不过需要确保模型的算子兼容性,尤其是那些自定义的损失函数和激活函数。另外,量化的问题也需要提前考虑,毕竟你们的模型可能会部署在移动端。
天问:暂时没有考虑这个。
李翠花:那就现在考虑,未来电脑上的业务都会转移到了手机,这是时代的必然性,不要抗拒它,尽快从电脑端转移到了APP。
不论是直播、购物网站、视频网站、通讯、站,还是各种健康不健康的网站,都要服从大势。
哪怕是网络游戏,也要尽快调整出手游模式来适应时代的发展。
谁先调整,谁就能吃到时代的红利。
天问:你觉得移动端最重要的是什么?
李翠花:算法,人工智能并不是一开始就要诞生出智慧生命,那不现实,是神才涉及的领域。
算法可以推荐类似的内容,更精准的为用户推荐他会喜欢的商品和视频,从而留住用户。
算法可以更迅捷的回答问题,更加准确。
如果是视频网站的话,算法机制可以说是核心内容了。
如果是购物网站的话,当然是价格了,在某宝某东之外,还有一个购物APP的生态位,它的卖点必然是便宜,现在就看谁能抢占了,我的建议是农村包围城市,以人传人的方式进行扩张。
本章未完,请点击下一页继续阅读!