勇者无畏
服务:2件诚信:80分
小帆船综合服务公司
服务:6件诚信:85分
远渡文化
服务:2件诚信:85分
深圳市有信念文化发...
服务:3件诚信:85分
巨皓知识产权
服务:10件诚信:90分
图像设计修复视频后...
服务:2件诚信:85分
勿忘初心
服务:2件诚信:80分
角美建晴建筑设计工...
服务:2件诚信:85分
深圳市猴王网络科技...
服务:2件诚信:85分
保家为民
服务:4件诚信:85分

什么是降维及常用的降维方法有哪些？

3933

发布：2021-10-11 19:40:56 来自芭比萌妹蚂蚜会员 L1

什么是降维及常用的降维方法有哪些？_智慧城市_智慧零售

降维是一个对数据集进行降维的过程，它取许多特征并将其表示为较少的特征。例如，维数缩减可以用来将一个包含20个特征的数据集缩减为几个特征。在无监督的学习任务中，通常使用降维来自动创建基于许多特征的类。为了更好地理解为什么以及如何使用维度约简，我们将研究与高维数据相关的问题以及最流行的降维方法。

维度是指数据集中的特性/列的数量。

人们通常认为，在机器学习中，更多的特征是更好的，因为它可以创建更精确的模型。然而，更多的特征并不一定转化为更好的模型。

数据集的特性在对模型的有用程度方面可能有很大的不同，许多特性并不重要。此外，数据集包含的特征越多，就需要越多的样本来确保不同的特征组合在数据中得到很好的表示。因此，样本数量与特征数量成比例增加。更多的样本和更多的特征意味着模型需要更加复杂，随着模型变得更加复杂，它们对过度拟合变得更加敏感。

减少数据集的维数有几个好处。如前所述，较简单的模型不太容易过度拟合，因为模型必须对特性如何相互关联做出较少的假设。此外，维数越小，训练算法所需的计算能力就越小。同样，对于维数较小的数据集，所需的存储空间也更少。

常用降维方法

降维可以通过特征选择或特征工程来实现。特征选择是工程师识别数据集最相关的特征，而特征工程是通过组合或转换其他特征来创建新特征的过程。

特征选择和工程可以通过编程或手动完成。当手动选择和设计特征时，可视化数据以发现特征和类之间的相关性是典型的。以这种方式执行维度缩减可能会耗费大量时间，因此，一些最常见的降维方法涉及到使用库中可用的算法，如Scikit learn for Python。这些常见的降维算法包括：主成分分析（PCA）、奇异值分解（SVD）和线性判别分析（LDA）。

用于无监督学习任务的降维算法通常是PCA和SVD，而用于有监督学习降维的算法通常是LDA和PCA。在有监督学习模型的情况下，新生成的特征被输入到机器学习分类器中。请注意，这里描述的用途只是一般的用例，而不是这些技术可能使用的唯一条件。上面描述的降维算法是简单的统计方法，它们在机器学习模型之外使用。

特别声明：本文仅供交流学习 , 版权归属原作者，并不代表蚂蚜网赞同其观点和对其真实性负责。若文章无意侵犯到您的知识产权，损害了您的利益，烦请与我们联系vmaya_gz@126.com，我们将在24小时内进行修改或删除。

û42 ñ16 0 98

平安城市前端布点的重要性和应用设计
“各地区按照城镇道路交叉口无死角，主要道路关键节点无盲区，人员密集区域无遗漏，以及要害部位、重要涉外场所、案件高发区域、治安复杂场所主要
阳光温暖空屋 ⋅2487人浏览 ⋅一个月前
在PLC编程时需要注意的一些问题
可编程序控制器(PLC)的应用中，我们常会碰到对继电器控制系统的改造问题，这时我们往往要参考原有的继电器控制电路来编制PLC的应用程序。
╰暴走的兔子╯ ⋅4849人浏览 ⋅一个月前
手机厂商加速布局物联网，抢占智能终端的先机
在最新季度的手机新机发布潮中，三星和vivo再次将在IoT（物联网）领域的发展推到台前。国产手机厂商在物联网领域的发展以小米的推进最为显
oО清风挽发oО ⋅661人浏览 ⋅一个月前
SICK光电传感器的特点及应用解析
在电子工业中，优化产品和流程是未来智能解决方案的核心任务。最终产品将更加小巧、扁平、轻盈，从而以全新尺寸拓展其性能。自动化解决方案越发精
采姑娘的小蘑菇 ⋅4217人浏览 ⋅一个月前
一种用于膀胱内压监测的光纤压力传感器FOP-M260
近年来，腹内压(intra-abdominalpressure，IAP)升高及其对心肺功能、腹内重要脏器(如肾脏、胃肠道)功能的影响已成
蓝衣裙摆 ⋅2574人浏览 ⋅一个月前
霍尔电流传感器的优点和作用
在一些变频器上，都会用到霍尔电流传感器，为了让器件之间的电流更好的被测量，可以加入采样电阻
爱你的小笨蛋 ⋅948人浏览 ⋅一个月前
运放补偿电容
运放补偿虽然很常见，但有时候也极具挑战性，尤其是在要求和约束条件超过设计师控制的情况下，设计师必须选择一种最优补偿技术之时。也许极具挑战
焒眀荢妑頭昻起唻 ⋅1711人浏览 ⋅一个月前
压力控制阀的故障与排除
在液压传动系统中，控制油液压力高低的液压阀称为压力控制阀，简称压力阀。这类阀的共同点是利用作用在阀芯上的液压力和弹簧力相平衡的原理工作。
蜜心萝莉酱 ⋅2689人浏览 ⋅一个月前
AI为电梯带来的不只是降低6分钟救援时间
不论是上班下班还是出门逛街，一天乘坐三四次电梯是正常的事。电梯为我们工作生活带来的便利有目共睹。但是也有意外，当我们在轿厢里刷着朋友圈，
姑娘拽天下 ⋅2294人浏览 ⋅一个月前
万亿美元市值也无法挽救无人驾驶的“人性化”
我打开一个打车app，只需手指点几下，几分钟后，一辆白色小型货车就会来路边接我。当今社会中，这种现象已成常态。但如果这辆车是无人驾驶汽车
半梦半醒半疯癫 ⋅2546人浏览 ⋅一个月前
德州仪器推出了一款准确度在正负1℃范围内的温度传感器集成体器件
日前，德州仪器(TI)宣布推出一款准确度在+/-1℃范围内的远程结温传感器与本地温度传感器集成一体的器件——TM
乱世梦红颜 ⋅3302人浏览 ⋅一个月前
嵌入式linux下u盘自动挂载的实现
一、方法一由于我调试的系统是基于LSDK的，所以没法直接使用openwrt中的hotplug完成此功能。所以使用了以下的方法。我实现的方
来瓶年的冰泉 ⋅2734人浏览 ⋅一个月前
智能PLC破茧成蝶的障碍与挑战
PLC是工业在3.0时代的产物，经过50多年的发展，技术不断推陈出新，产品种类不断丰富。作为控制工业生产系统的大脑，PLC的出现取代了之
万象皆为过客 ⋅1983人浏览 ⋅一个月前
案例|注塑成型工艺——塑料容器生产线
全球工业4.0时代已经到来，注塑产业的发展也将迎来新机遇，整个产业也从传统型注塑过渡到智能化注塑。智能注塑生产线帮助客户实现各类大型塑料
夨落旳尐孩 ⋅1264人浏览 ⋅一个月前
分布式存储的特性/类型/需要解决的问题
互联网的发展催生了云计算和大数据的发展，云计算和大数据的本质都是构建低成本，高性能高可用的分布式存储系统，本文简单介绍分布式存储的一些基
橱窗的光 ⋅3056人浏览 ⋅一个月前
塑料齿轮行业颁布国内首个标准
塑料齿轮行业迎来了首个国家标准。近日，国家标准化管理委员会正式发布了塑料齿轮精度国家标准《GB/T38192—2019注射成型塑料圆柱齿
木槿暖夏 ⋅1986人浏览 ⋅一个月前
十四位串行AD转换器MAX194芯片的工作原理、性能和应用设计分析
在一些实时数据采集与信息处理电路中，要满足数据采集的精度和速度要求，以必须采用分辨率高，转换速度快的AD转换器。MAX194是一种性能优
全网暗恋者 ⋅2234人浏览 ⋅一个月前
中国制造怎么办？33位实体经济领军人物给了这些建议
当前，制造业面临着新一轮科技和产业的革命机遇，同时也遭遇去产能、环保升级等转型挑战，以及来自人工智能、5G、云计算等新技术的冲击，中国制
有阳光还感觉冷 ⋅2223人浏览 ⋅一个月前
必须知道的十大人机界面常识
人机界面常识对初学者来说是首要了解的知识，产品由硬件和软件两部分组成，硬件部分包括处理器、显示单元、输入单元、通讯接口、数据存贮单元等。
陌上蔷薇 ⋅2204人浏览 ⋅一个月前
和德国日本相比，中国机器人发展得怎么样了？
行业动态】全球机器人市场正成为各路资本和企业“抢滩”的风口。按照在8月15日~19日举办的2018世界机器人大会公布数据，2018年，全
如花的旋律 ⋅3586人浏览 ⋅一个月前