数据预处理——混合型/离散型 数据怎么降维 [问题点数:80分]

Bbs1
本版专家分:0
结帖率 97.14%
Bbs1
本版专家分:0
大量分类数据维问题

有大量的二分类和等级分类指标,需要进行<em>降</em>维处理以进行建模和拟合,lasso回归处理结果不理想,请问还有哪些方法可以用?最好是能R语言实现的。谢谢!

数据预处理--离散变量处理

<em>离散</em>变量标签处理 1.类别变量映射为原始变量 原始<em>数据</em> import pandas as pd df = pd.DataFrame([ ['green', 'M', 10.1, 'class1'], ['red', 'L', 13.5, 'class2'], ['blue', 'XL', 15.3, 'c...

处理离散特征和连续特征共存的情况 归一化 论述了对离散特征进行one-hot编码的意义

处理<em>离散</em><em>型</em>特征和连续<em>型</em>特征并存的情况,如何做归一化。 参考博客进行了总结: https://www.quora.com/What-are-good-ways-to-handle-discrete-and-continuous-inputs-together 总结如下: 1、拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是

数据维和特征选择

<em>数据</em><em>降</em>维和特征选择 博主言:本文作为理论和概念整理,不做公式推导和详解计算过程,如需了解相关概念的计算公式和过程,在文后的参考链接中有详细的公式,计算过程和实例。

转:机器学习中维的十个技巧

前言 由于“维度灾难”(curse of dimensionality)的存在,很多统计方法难以应用到高维<em>数据</em>上。虽然收集到的<em>数据</em>点很多,但是它们会散布在一个庞大的、几乎不可能进行彻底探索的高维空间中。 在分析高维<em>数据</em>时,<em>降</em>维(Dimensionality reduction,DR)方法是我们不可或缺的好帮手。 通过<em>降</em>低<em>数据</em>的维度,你可以把这个复杂棘手的问题变得简单轻松。除去噪音但保存了所关注信息...

十个技巧,让你成为“维”专家

大<em>数据</em>文摘出品 来源:PLOS 编译:啤酒泡泡、刘兆娜、李雷、sirin、邢畅、武帅、钱天培 在分析高维<em>数据</em>时,<em>降</em>维(Dimensionality reduction,DR)方法是我们不可或缺的好帮手。 作为<em>数据</em>去噪简化的一种方法,它对处理大多数现代生物<em>数据</em>很有帮助。在这些<em>数据</em>集中,经常存在着为单个样本同时收集数百甚至数百万个测量值的情况。 由于“维度灾难”(cur...

在分类及预测任务中对高维类别变量的预处理方法

本论文是SIGKDD上发表的一篇<em>数据</em><em>预处理</em>的文章,主要讲述了在分类与预测任务重,如何对高维的类别变量进行<em>预处理</em>,方法简单奇妙,值得一看,如果不想看引文,可以看我的机器学习专栏博客,有分析这篇论文的文章

数据预处理系列:(五)分类变量处理

分类变量处理 分类变量是经常遇到的问题。一方面它们提供了信息;另一方面,它们可能是文本形式——纯文字或者与文字相关的整数——就像表格的索引一样。 因此,我们在建模的时候往往需要将这些变量量化,但是仅仅用简单的id或者原来的形式是不行的。因为我们也需要避免在上一节里通过阈值创建二元特征遇到的问题。如果我们把<em>数据</em>看成是连续的,那么也必须解释成连续的。

在分类及预测任务中对高维类别(category)变量的预处理方法

引言众所周知,<em>数据</em>挖掘中大约有80%的时间被用来做<em>数据</em><em>预处理</em>。其中高维类别<em>数据</em>是<em>数据</em>挖掘算法(比如神经网络、线性or逻辑回归、SVM)最具挑战性的<em>数据</em>类<em>型</em>。事实上,在一些像决策树或者一些规则归纳的学习算法中,对类别<em>数据</em>并不需要额外的处理。但是一些回归算法却需要将每一个输入特征都转变成数值类<em>型</em>的特征。而且在现实生活中,我们需要解决的分类或者预测问题的<em>数据</em>集中,充满了类别属性,比如:ZIP码,SIC,I

数据预处理,PCA主成分分析

from sklearn.decomposition import PCA my_pca = PCA(n_components=7) #10个属性删了3个剩7个 #<em>数据</em>表中不允许出现<em>离散</em><em>数据</em>(salary,department),而且分析的left属性也不需要进行pca处理,因为是我们关注的属性 lower_mat = my_pca.fit_transform(df.drop(labels...

基于sklearn同时处理连续特征和离散特征

核心思路: 先用LabelEncoder对<em>离散</em>特征编码,因为onehotencoder只能处理数值 然后使用OneHotEncoder编码,生成稀疏表示的特征 再使用sparse.hstack连接连续特征和稀疏特征 为什么不使用pd.get_dummy呢,因为这样是直接生成的稠密矩阵,内存开销太大 # coding=utf-8 # @author: bryan from skle...

机器学习之混合类数据的使用

在机器学习中,不同类<em>型</em>的<em>数据</em>(numeric, categorical, Continuous and Text data)的混合使用,一直是机器学习中<em>数据</em>处理的难点,处理的方式可能对模<em>型</em>的效果产生重要的影响。 神经网络很强大,但是也没办法直接处理类别<em>型</em>的变量,需要经过如one-hot编码的<em>预处理</em>之后才能放进网络去训练。 Understanding Categorical Data 类别...

R语言-混合数据聚类

利用聚类分析,我们可以很容易地看清<em>数据</em>集中样本的分布情况。以往介绍聚类分析的文章中通常只介绍如何处理连续<em>型</em>变量,这些文字并没有过多地介绍如何处理混合<em>型</em><em>数据</em>(如同时包含连续<em>型</em>变量、名义<em>型</em>变量和顺序<em>型</em>变量的<em>数据</em>)。本文将利用 Gower 距离、PAM(partitioning around medoids)算法和轮廓系数来介绍如何对混合<em>型</em><em>数据</em>做聚类分析。 ----------------------...

数据预处理—归一化(连续值和离散值)

归一化原因1. 如果多个特征之间数值差异较大,那么收敛速度会很慢。如吴恩达老师在《机器学习》中给出的例子: x1的取值为0-2000,而x2的取值为1-5,假如只有这两个特征,对其进行优化时,会得到一个窄长的椭圆形,导致在梯度下<em>降</em>时,梯度的方向为垂直等高线的方向而走之字形路线,这样会使迭代很慢,相比之下,右图的迭代就会很快 2. 在涉及到距离计算的模<em>型</em>中,若多个特征之间数值差异较大,那么数值小的特征

【Dimensionality Reduction】数据维方法分类

<em>数据</em><em>降</em>维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原<em>数据</em>集紧致的低维表示。 <em>数据</em><em>降</em>维工具箱drtoolbox中众多算法,这里简单做个分类。 因为很多并没有仔细了解,在此次只对八种方法做分类:主成分分析(Principal Component Analysis,PCA)、线性判别分析(Linear Discriminant Analysis,LDA)、等...

一些变量筛选方法——5、真实数据与总结

这里使用两个真实<em>数据</em>进行前面所述方法的应用。 真实<em>数据</em> 在实际<em>数据</em>运用中,针对高维和超高维<em>数据</em>的情况,算法该如何使用?如何实现?这里我们使用两组<em>数据</em>,一组是课本中提到的Hitters<em>数据</em>,另一组是自己搜索整理而出的土耳其新闻<em>数据</em>。前者是数十维,后者则是上千维。 课本Hitters<em>数据</em> 课本中的案例实验是以Hitters<em>数据</em>为例,这里进行重现。 <em>数据</em>简介 这个<em>数据</em>集取...

维算法总结

作者:jliang https://blog.csdn.net/jliang3 1.<em>降</em>维简介 1)相关背景 (1)在许多领域的研究与应用中,通常需要对含有多个变量的<em>数据</em>进行观测,收集大量<em>数据</em>后进行分析寻找规律。 多变量大<em>数据</em>集无疑会为研究和应用提供丰富的信息,但是也在一定程度上增加了<em>数据</em>采集的工作量。 更重要的是在很多情形下,许多变量之间可能存在相关性,从而增加了问题分析的复杂性。 ...

离散变量处理

one-hot encoding  假如多个特征需要独热码编码,那么久按照上面的方法依次将每个特征的独热码拼接起来:    {sex:{male, female,other}}    {grade:{一年级, 二年级,三年级, 四年级}}  此时对于输入为{sex:male; grade: 四年级}进行独热编码,可以首先将sex按照上面的进行编码得到{100},然后按照grade进行编码为{0001

特征选择与

特征选择与<em>降</em>维 【直接从word复制过来的...格式真是惨不忍睹....阿西吧以后再改吧...o(╥﹏╥)o】 参考资料: 西瓜书《机器学习》 Sklearn官方文档(中文版:https://www.cnblogs.com/stevenlk/p/6543628.html) 博客 https://www.cnblogs.com/stevenlk/p/6543628.html 官网 ht...

数据维方法小结

<em>数据</em>的形式是多种多样的,维度也是各不相同的,当实际问题中遇到很高的维度时,如何给他<em>降</em>到较低的维度上?前文提到进行属性选择,当然这是一种很好的方法,这里另外提供一种从高维特征空间向低纬特征空间映射的思路。<em>数据</em><em>降</em>维的目的  <em>数据</em><em>降</em>维,直观地好处是维度<em>降</em>低了,便于计算和可视化,其更深层次的意义在于有效信息的提取综合及无用信息的摈弃。<em>数据</em><em>降</em>维的方法  主要的方法是线性映射和非线性映射方法两大类。

数据预处理工作中的几个关键主题探讨:聚集、抽样、维、离散化、变量变换等

<em>数据</em><em>预处理</em>是<em>数据</em>挖掘领域必不可少的前提工作。经过<em>预处理</em>的功<em>数据</em>才更加有质量,更好地适应<em>数据</em>挖掘的算法过程、减少运算量或优化运算过程,在某些时候甚至起到决定结果好坏的作用。 我们讨论如下几个主题: 一、聚集 二、抽样 三、维归约(<em>降</em>维) 四、特征子集 五、特征创建 六、<em>离散</em>化和二元化 七、变量变换 粗略地说,我们要探讨的问题分类:对<em>数据</em>的分析和对<em>数据</em>属性的创建/修改。 有些比较简...

数据维——PCA(主成分分析)算法原理

引言 <em>数据</em><em>降</em>维就是指采用某种映射方法,将高维空间中的<em>数据</em>点映射到低维度的空间中。不同于回归、分类和聚类,<em>降</em>维方法并不是用来做模<em>型</em>预测的,其本身是一种<em>数据</em><em>预处理</em>方法。 在<em>降</em>维方法中,尤为重要的是:被抽取出的维度表示应该仍能捕捉大部分的原始<em>数据</em>的变化和结构。换句话说,<em>降</em>维的目的就是为了排除<em>数据</em>中的噪音并保留<em>数据</em>原有的隐含结构。有时候,原始<em>数据</em>的维度太高,若此时直接使用分类、回归等方法进行机器学习建...

决策树之C4.5实现(离散属性与连续,属性并存)

    这两天自己实现了一个C4.5的决策树,用的是UCI上的一个<em>数据</em>集abalone.data    具体<em>数据</em>如下(前5条):M,0.455,0.365,0.095,0.514,0.2245,0.101,0.15,15M,0.35,0.265,0.09,0.2255,0.0995,0.0485,0.07,7F,0.53,0.42,0.135,0.677,0.2565,0.1415,0.21,9M...

关于时间序列中数据维简单讨论

本文只讨论单变量<em>离散</em><em>型</em>时间序列,在这里解释一个问题本文谈论的<em>降</em>维是将时间作为维度来讨论的。由于时间序列的高维性,<em>数据</em>量大以及不断更新等特点,导致了对于时间序列的处理、挖掘变得异常困难,因此采用适当的方法来表示时间序列成了目前处理时间序列首先需要解决的问题,目前来说有这几种常见的方法:分段线性表示,基于域变换的表示方法,符号化表示,基于模<em>型</em>的表示方法,奇异值分解表示法等。 其中分段线性表示法是我们...

数据

<em>数据</em><em>降</em>维 分类 PCA(主成分分析<em>降</em>维) 相关系数<em>降</em>维 PCA <em>降</em>维(不常用) 实现思路 对<em>数据</em>进行标准化 计算出<em>数据</em>的相关系数矩阵(是方阵, 维度是nxn, n是特征的数量) 计算出相关系数矩阵的特征值和特征向量(虽然这里说的是向量, 但是是矩阵, 这个矩阵的每一列都是特征值或者特征向量, 是nxn), 特征值是每一个特征的特征值的集合, 但是在特征向量是每一个特征的特征向量的集...

分类、回归、聚类、维的区别

  机器学习的类别 机器学习分为四大块,如下图所示,分别是:  classification (分类),regression (回归),  clustering (聚类), dimensionality reduction (<em>降</em>维)。 区分方式 给定一个样本特征 , 我们希望预测其对应的属性值 , 如果  是<em>离散</em>的, 那么这就是一个分类问题,反之,如果  是连续的实数, 这就是一个回...

四大机器学习维算法:PCA、LDA、LLE、Laplacian Eigenmaps

四大机器学习<em>降</em>维算法:PCA、LDA、LLE、Laplacian Eigenmaps 引言 机器学习领域中所谓的<em>降</em>维就是指采用某种映射方法,将原高维空间中的<em>数据</em>点映射到低维度的空间中。<em>降</em>维的本质是学习一个映射函数 f : x->y,其中x是原始<em>数据</em>点的表达,目前最多使用向量表达形式。 y是<em>数据</em>点映射后的低维向量表达,通常y的维度小于x的维度(当然提高维度也是可以的)。f可能是显式的

看!数据分析领域中最为人称道的七种维方法

http://dataunion.org/20803.html 感谢王穆荣的投稿,转载请注明出处:数盟社区 近来由于<em>数据</em>记录和属性规模的急剧增长,大<em>数据</em>处理平台和并行<em>数据</em>分析算法也随之出现。于此同时,这也推动了<em>数据</em><em>降</em>维处理的应用。实际上,<em>数据</em>量有时过犹不及。有时在<em>数据</em>分析应用中大量的<em>数据</em>反而会产生更坏的性能。 最新的一个例子是采用 2009 KDD Challenge 大<em>数据</em>集来预测客户

机器学习中的维算法汇总归纳

最近看了<em>降</em>维的各类算法,想简单做个回顾和小结,先上图 一、浅谈协方差矩阵 1.1、统计学的基本概念 均值:x&amp;nbsp;¯&amp;nbsp;=∑&amp;nbsp;n&amp;nbsp;i=1&amp;nbsp;x&amp;nbsp;i&amp;nbsp;n&amp;nbsp;&amp;nbsp;x¯=∑i=1nxin\bar x =\dfrac {\sum_{i=1}^n x_i} n 方差:var(x)=∑&amp;nbsp;n&amp;nbsp;i=...

文本分类中的维方法总结

引言 人们通常采用向量空间模<em>型</em>来描述文本向量,但是如果直接用分词算法和词频统计方法得到的特征项来表示文本向量中的各个维,那么这个向量的维度将是非常的大。 这种未经处理的文本矢量不仅给后续工作带来巨大的计算开销,使整个处理过程的效率非常低下,而且会损害分类、聚类算法的精确性,从而使所得到的结果很难令人满意。 所以,在文本分类中,<em>降</em>维有时候是非常关键的一环。为什么需要<em>降</em>维?也就<em>降</em>维有什么好处?

数据分析之数据

1、<em>降</em>维的作用: (1)<em>降</em>低时间的复杂度和空间复杂度 (2)节省了提取不必要特征的开销 (3)去掉<em>数据</em>集中夹杂的噪音 (4)较简单的模<em>型</em>在小<em>数据</em>集上有更强的鲁棒性 (5)当<em>数据</em>能有较少的特征进行解释,我们可以更好地解释<em>数据</em>,是的我们可以提取知识 (6)实现<em>数据</em>的可视化 2、<em>降</em>维的目的 用来进行特征选择和特征提取。 ①特征选择:选择重要的特征子集,删除其余特征; ②特征提取:由原始特征形成的较少的新...

非常见维方法:Laplacian Eigenmaps 拉普拉斯特征映射

拉普拉斯矩阵Laplacian matrix 的定义谈到机器学习中的<em>降</em>维技术,可能大多数了解一点机器学习的朋友都知道PCA,今天为大家介绍一种新的<em>降</em>维方法——拉普拉斯特征映射 拉普拉斯矩阵(Laplacian matrix)),也称为基尔霍夫矩阵, 是表示图的一种矩阵。给定一个有n个顶点的图G=(V,E) ,其拉普拉斯矩阵被定义为:L=D-W 其中D为图的度矩阵,W为图的邻接矩阵。(不知道度

谱聚类算法详解

如果说 K-means 和 GMM 这些聚类的方法是古代流行的算法的话,那么这次要讲的 Spectral Clustering 就可以算是现代流行的算法了,中文通常称为“谱聚类”。由于使用的矩阵的细微差别,谱聚类实际上可以说是一“类”算法。 Spectral Clustering 和传统的聚类方法(例如 K-means)比起来有不少优点: 和 K-medoids 类似,Spectral

维总结之Graph Laplacian,Laplacian EM

接着写<em>数据</em><em>降</em>维算法。上一篇文章介绍了 PCA, Factor Analysis, LLE 等三个算法, 按照顺序这篇文章就该讲到 Laplacian Eigenmaps 了,但是作者认为直接讲 Laplican Eigenmaps 好像有点太干了, 不太容易理解, 请允许我夹带点私货, 先从 Graph Laplacian 开始讲起 (graph Laplacian 是 graph theor

数据挖掘中的特征预处理以及特征选择

首先,特征的<em>预处理</em>主要有以下方式:   1、异常值和缺失值检测处理   2、归一化,不同自变量之间的<em>数据</em>范围不一致,导致比较复杂,两个维度范围相差的越大,梯度下<em>降</em>的越慢,还可能永远无法收敛,利用归一化加快收敛的速度。   归一化的方式   x-min/max-min   z-score=x–μ/σ   3、改变<em>数据</em>的分布   对于连续<em>型</em>的变量的原始分布严重

【高分】求解大稀疏矩阵的特征值及特征向量,来都有分,提供思路

谢谢

PCA数据

http://blog.csdn.net/pipisorry/article/details/49235529 这个没时间写,下次有空写吧╮(╯_╰)╭ from: http://blog.csdn.net/pipisorry/article/details/49235529 ref:

理解word2vec的训练过程

生成词向量是自然语言处理中的基本过程,此前对此只知道使用但是一直不知道其原理。 最近补补课,仔细学习了wordvec,上网查资料的时候发现很多博客资料上讲到的主要是理论,不好全面理解;而对于介绍应用的文章又偏重于某个工具的使用而不是训练的细节,所以特别参考了Tensorflow上的实现写下本篇文章,以防忘记。其中Tensorflow实现word2vec请点击这里

理解稀疏编码sparse coding

2016年01月03日 19:31:25阅读数:8558稀疏编码系列:(一)----Spatial Pyramid 小结(二)----图像的稀疏表示——ScSPM和LLC的总结(三)----理解sparse coding(四)----稀疏模<em>型</em>与结构性稀疏模<em>型</em>-----------------------------------------------------------------------...

干货|机器学习-稀疏矩阵的处理

https://www.toutiao.com/a6647043426384609805/   2019-01-16 18:43:19   什么是稀疏矩阵? 我们知道矩阵是一个由m行和n列组成的二维<em>数据</em>对象,因此一共有m x n个数值。当这个矩阵的绝大部分数值为零,且非零元素呈不规律分布时,则称该矩阵为稀疏矩阵(Sparse Matrix)。下图所示的是一个8 x 8的稀疏矩阵。 ...

主成分分析(PCA)原理详解

机器学习中有关特征选择的问题,其实就是要剔除和类标签无关的特征,去除噪声或者冗余。在这种情况下,需要一种特征<em>降</em>维的方法来减少特征数,减少噪音和冗余,减少过度拟合的可能性。PCA的思想是将n维特征映射到k维上(k<n),这k维是全新的正交特征。这k维特征称为主成分,是重新构造出来的k维特征,而不是简单地从n维特征中去除其余n-k维特征。现在的问题是,对于很高维<em>数据</em>,你能想象其分布吗?就算能描述分布,如何精确地找到这些主成分的轴?如何衡量你提取的主成分到底占了整个<em>数据</em>的多少信息?所以,我们就要用到主成分分析的处

连续特征离散化的好处

在实现某些算法时,只看到结论说有的连续特征需要<em>离散</em>化,<em>离散</em>化后效果会更好,巴拉巴拉。。。但是为什么要<em>离散</em>化还一直是云里雾里,今天特意研究了一下,记录如下: 1. <em>离散</em>特征的增加和减少都很容易,易于模<em>型</em>的快速迭代; 2. 稀疏向量内积乘法运算速度快,计算结果方便存储,容易扩展; 3. <em>离散</em>化后的特征对异常<em>数据</em>有很强的鲁棒性:比如一个特征是年龄>30是1,否则0。如果特征没有<em>离散</em>化,一个异常

PCA维结果对比【带Y和不带Y】,Y是每个样本数据对应的预测变量(因变量)

希望能得到@-柚子皮-老师的指导: 几点小的疑问: 1,在带Y和不带Y的情况下,图的差异很明显。如何看出“每个维度下不同Y的占比” 2,以及如何理解“占比越不平均熵越小” 3,是否预先进行<em>数据</em>标准化对可视化的结果影响很大,如果不进行标准化,则可视化结果和其他<em>降</em>维可视化算法很类似(如MDS多维标度法,LDA线性判别分析等等),但是标准化之后,结果完全不一样。。这个应该如何理解呢?是否归...

下列哪些方法可以用来对高维数据进行维:

感想<em>降</em>维的方法有很多种,比如auto encoder,pca, LDA等,但是列举全还是不怎么行,看来还是要刷题。problem下列哪些方法可以用来对高维<em>数据</em>进行<em>降</em>维:A. LASSOB. 主成分分析法C. 聚类分析D. 小波分析法E. 线性判别法F. 拉普拉斯特征映射答案: A B C D E FanalysisLasso(Least absolute shrinkage and selecti...

机器学习之维方法总结

<em>降</em>维方法分为线性<em>降</em>维方法和非线性<em>降</em>维方法,看下表: 本文结构如下: 线性<em>降</em>维方法 主成分分析法 线性判别法 奇异值分解法 因子分析法 非线性<em>降</em>维方法~~流形学习简介 说到维度,其目的是用来进行特征选择和特征提取,注意特征选择和特征提取这二者的不同之处: 特征选择:选择重要特征子集,删除其余特征。 特征提取:由原始特征形成较少的新特征。 在特征提取中,我们要找到k个新的维度的集合,这

12种维方法终极指南

来源:Analytics Vidhya编译:Bot授权自 论智你遇到过特征超过1000个的<em>数据</em>集吗?超过5万个的呢?我遇到过。<em>降</em>维是一个非常具有挑战性的任务,尤其是当你不知道该从哪里开始的时候。拥有这么多变量既是一个恩惠——<em>数据</em>量越大,分析结果越可信;也是一种诅咒——你真的会感到一片茫然,无从下手。面对这么多特征,在微观层面分析每个变量显然不可...

大学四年自学走来,这些私藏的实用工具/学习网站我贡献出来了

大学四年,看课本是不可能一直看课本的了,对于学习,特别是自学,善于搜索网上的一些资源来辅助,还是非常有必要的,下面我就把这几年私藏的各种资源,网站贡献出来给你们。主要有:电子书搜索、实用工具、在线视频学习网站、非视频学习网站、软件下载、面试/求职必备网站。 注意:文中提到的所有资源,文末我都给你整理好了,你们只管拿去,如果觉得不错,转发、分享就是最大的支持了。 一、电子书搜索 对于大部分程序员...

在中国程序员是青春饭吗?

今年,我也32了 ,为了不给大家误导,咨询了猎头、圈内好友,以及年过35岁的几位老程序员……舍了老脸去揭人家伤疤……希望能给大家以帮助,记得帮我点赞哦。 目录: 你以为的人生 一次又一次的伤害 猎头界的真相 如何应对互联网行业的「中年危机」 一、你以为的人生 刚入行时,拿着傲人的工资,想着好好干,以为我们的人生是这样的: 等真到了那一天,你会发现,你的人生很可能是这样的: ...

Java基础知识面试题(2020最新版)

文章目录Java概述何为编程什么是Javajdk1.5之后的三大版本JVM、JRE和JDK的关系什么是跨平台性?原理是什么Java语言有哪些特点什么是字节码?采用字节码的最大好处是什么什么是Java程序的主类?应用程序和小程序的主类有何不同?Java应用程序与小程序之间有那些差别?Java和C++的区别Oracle JDK 和 OpenJDK 的对比基础语法<em>数据</em>类<em>型</em>Java有哪些<em>数据</em>类<em>型</em>switc...

我以为我学懂了数据结构,直到看了这个导图才发现,我错了

<em>数据</em>结构与算法思维导图

技术大佬:我去,你写的 switch 语句也太老土了吧

昨天早上通过远程的方式 review 了两名新来同事的代码,大部分代码都写得很漂亮,严谨的同时注释也很到位,这令我非常满意。但当我看到他们当中有一个人写的 switch 语句时,还是忍不住破口大骂:“我擦,小王,你丫写的 switch 语句也太老土了吧!” 来看看小王写的代码吧,看完不要骂我装逼啊。 private static String createPlayer(PlayerTypes p...

和黑客斗争的 6 天!

互联网公司工作,很难避免不和黑客们打交道,我呆过的两家互联网公司,几乎每月每天每分钟都有黑客在公司网站上扫描。有的是寻找 Sql 注入的缺口,有的是寻找线上服务器可能存在的漏洞,大部分都...

Linux 会成为主流桌面操作系统吗?

整理 |屠敏出品 | CSDN(ID:CSDNnews)2020 年 1 月 14 日,微软正式停止了 Windows 7 系统的扩展支持,这意味着服役十年的 Windows 7,属于...

讲一个程序员如何副业月赚三万的真实故事

loonggg读完需要3分钟速读仅需 1 分钟大家好,我是你们的校长。我之前讲过,这年头,只要肯动脑,肯行动,程序员凭借自己的技术,赚钱的方式还是有很多种的。仅仅靠在公司出卖自己的劳动时...

学习总结之HTML5剑指前端(建议收藏,图文并茂)

前言学习《HTML5与CSS3权威指南》这本书很不错,学完之后我颇有感触,觉得web的世界开明了许多。这本书是需要有一定基础的web前端开发工程师。这本书主要学习HTML5和css3,看...

女程序员,为什么比男程序员少???

昨天看到一档综艺节目,讨论了两个话题:(1)中国学生的数学成绩,平均下来看,会比国外好?为什么?(2)男生的数学成绩,平均下来看,会比女生好?为什么?同时,我又联想到了一个技术圈经常讨...

搜狗输入法也在挑战国人的智商!

故事总是一个接着一个到来...上周写完《鲁大师已经彻底沦为一款垃圾流氓软件!》这篇文章之后,鲁大师的市场工作人员就找到了我,希望把这篇文章删除掉。经过一番沟通我先把这篇文章从公号中删除了...

副业收入是我做程序媛的3倍,工作外的B面人生是怎样的?

提到“程序员”,多数人脑海里首先想到的大约是:为人木讷、薪水超高、工作枯燥…… 然而,当离开工作岗位,撕去层层标签,脱下“程序员”这身外套,有的人生动又有趣,马上展现出了完全不同的A/B面人生! 不论是简单的爱好,还是正经的副业,他们都干得同样出色。偶尔,还能和程序员的特质结合,产生奇妙的“化学反应”。 @Charlotte:平日素颜示人,周末美妆博主 大家都以为程序媛也个个不修边幅,但我们也许...

MySQL数据库面试题(2020最新版)

文章目录<em>数据</em>库基础知识为什么要使用<em>数据</em>库什么是SQL?什么是MySQL?<em>数据</em>库三大范式是什么mysql有关权限的表都有哪几个MySQL的binlog有有几种录入格式?分别有什么区别?<em>数据</em>类<em>型</em>mysql有哪些<em>数据</em>类<em>型</em>引擎MySQL存储引擎MyISAM与InnoDB区别MyISAM索引与InnoDB索引的区别?InnoDB引擎的4大特性存储引擎选择索引什么是索引?索引有哪些优缺点?索引使用场景(重点)...

新一代神器STM32CubeMonitor介绍、下载、安装和使用教程

关注、星标公众号,不错过精彩内容作者:黄工公众号:strongerHuang最近ST官网悄悄新上线了一款比较强大的工具:STM32CubeMonitor V1.0.0。经过我研究和使用之...

记一次腾讯面试,我挂在了最熟悉不过的队列上……

腾讯后台面试,面试官问:如何自己实现队列?

如果你是老板,你会不会踢了这样的员工?

有个好朋友ZS,是技术总监,昨天问我:“有一个老下属,跟了我很多年,做事勤勤恳恳,主动性也很好。但随着公司的发展,他的进步速度,跟不上团队的步伐了,有点...

我入职阿里后,才知道原来简历这么写

私下里,有不少读者问我:“二哥,如何才能写出一份专业的技术简历呢?我总感觉自己写的简历太烂了,所以投了无数份,都石沉大海了。”说实话,我自己好多年没有写过简历了,但我认识的一个同行,他在阿里,给我说了一些他当年写简历的方法论,我感觉太牛逼了,实在是忍不住,就分享了出来,希望能够帮助到你。 01、简历的本质 作为简历的撰写者,你必须要搞清楚一点,简历的本质是什么,它就是为了来销售你的价值主张的。往深...

冒泡排序动画(基于python pygame实现)

本项目效果初始截图如下 动画见本人b站投稿:https://www.bilibili.com/video/av95491382 本项目对应github地址:https://github.com/BigShuang python版本:3.6,pygame版本:1.9.3。(python版本一致应该就没什么问题) 样例gif如下 ======================= 大爽歌作,mad

Redis核心原理与应用实践

Redis核心原理与应用实践 在很多场景下都会使用Redis,但是到了深层次的时候就了解的不是那么深刻,以至于在面试的时候经常会遇到卡壳的现象,学习知识要做到系统和深入,不要把Redis想象的过于复杂,和Mysql一样,是个读取<em>数据</em>的软件。 有一个理解是Redis是key value缓存服务器,更多的优点在于对value的操作更加丰富。 安装 yum install redis #yum安装 b...

现代的 “Hello, World”,可不仅仅是几行代码而已

作者 |Charles R. Martin译者 | 弯月,责编 | 夕颜头图 |付费下载自视觉中国出品 | CSDN(ID:CSDNnews)新手...

带了6个月的徒弟当了面试官,而身为高级工程师的我天天修Bug......

即将毕业的应届毕业生一枚,现在只拿到了两家offer,但最近听到一些消息,其中一个offer,我这个组据说客户很少,很有可能整组被裁掉。 想问大家: 如果我刚入职这个组就被裁了怎么办呢? 大家都是什么时候知道自己要被裁了的? 面试软技能指导: BQ/Project/Resume 试听内容: 除了刷题,还有哪些技能是拿到offer不可或缺的要素 如何提升面试软实力:简历, 行为面试,沟通能...

!大部分程序员只会写3年代码

如果世界上都是这种不思进取的软件公司,那别说大部分程序员只会写 3 年代码,恐怕就没有程序员这种职业。

离职半年了,老东家又发 offer,回不回?

有小伙伴问松哥这个问题,他在上海某公司,在离职了几个月后,前公司的领导联系到他,希望他能够返聘回去,他很纠结要不要回去? 俗话说好马不吃回头草,但是这个小伙伴既然感到纠结了,我觉得至少说明了两个问题:1.曾经的公司还不错;2.现在的日子也不是很如意。否则应该就不会纠结了。 老实说,松哥之前也有过类似的经历,今天就来和小伙伴们聊聊回头草到底吃不吃。 首先一个基本观点,就是离职了也没必要和老东家弄的苦...

2020阿里全球数学大赛:3万名高手、4道题、2天2夜未交卷

阿里巴巴全球数学竞赛( Alibaba Global Mathematics Competition)由马云发起,由中国科学技术协会、阿里巴巴基金会、阿里巴巴达摩院共同举办。大赛不设报名门槛,全世界爱好数学的人都可参与,不论是否出身数学专业、是否投身数学研究。 2020年阿里巴巴达摩院邀请北京大学、剑桥大学、浙江大学等高校的顶尖数学教师组建了出题组。中科院院士、美国艺术与科学院院士、北京国际数学...

为什么你不想学习?只想玩?人是如何一步一步废掉的

不知道是不是只有我这样子,还是你们也有过类似的经历。 上学的时候总有很多光辉历史,学年名列前茅,或者单科目大佬,但是虽然慢慢地长大了,你开始懈怠了,开始废掉了。。。 什么?你说不知道具体的情况是怎么样的? 我来告诉你: 你常常潜意识里或者心理觉得,自己真正的生活或者奋斗还没有开始。总是幻想着自己还拥有大把时间,还有无限的可能,自己还能逆风翻盘,只不是自己还没开始罢了,自己以后肯定会变得特别厉害...

HTTP与HTTPS的区别

面试官问HTTP与HTTPS的区别,我这样回答让他竖起大拇指!

程序员毕业去大公司好还是小公司好?

虽然大公司并不是人人都能进,但我仍建议还未毕业的同学,尽力地通过校招向大公司挤,但凡挤进去,你这一生会容易很多。 大公司哪里好?没能进大公司怎么办?答案都在这里了,记得帮我点赞哦。 目录: 技术氛围 内部晋升与跳槽 啥也没学会,公司倒闭了? 不同的人脉圈,注定会有不同的结果 没能去大厂怎么办? 一、技术氛围 纵观整个程序员技术领域,哪个在行业有所名气的大牛,不是在大厂? 而且众所...

男生更看重女生的身材脸蛋,还是思想?

往往,我们看不进去大段大段的逻辑。深刻的哲理,往往短而精悍,一阵见血。问:产品经理挺漂亮的,有点心动,但不知道合不合得来。男生更看重女生的身材脸蛋,还是...

程序员为什么千万不要瞎努力?

本文作者用对比非常鲜明的两个开发团队的故事,讲解了敏捷开发之道 —— 如果你的团队缺乏统一标准的环境,那么即使勤劳努力,不仅会极其耗时而且成果甚微,使用...

为什么程序员做外包会被瞧不起?

二哥,有个事想询问下您的意见,您觉得应届生值得去外包吗?公司虽然挺大的,中xx,但待遇感觉挺低,马上要报到,挺纠结的。

面试阿里p7,被按在地上摩擦,鬼知道我经历了什么?

面试阿里p7被问到的问题(当时我只知道第一个):@Conditional是做什么的?@Conditional多个条件是什么逻辑关系?条件判断在什么时候执...

终于懂了TCP和UDP协议区别

终于懂了TCP和UDP协议区别

无代码时代来临,程序员如何保住饭碗?

编程语言层出不穷,从最初的机器语言到如今2500种以上的高级语言,程序员们大呼“学到头秃”。程序员一边面临编程语言不断推陈出新,一边面临由于许多代码已存在,程序员编写新应用程序时存在重复“搬砖”的现象。 无代码/低代码编程应运而生。无代码/低代码是一种创建应用的方法,它可以让开发者使用最少的编码知识来快速开发应用程序。开发者通过图形界面中,可视化建模来组装和配置应用程序。这样一来,开发者直...

面试了一个 31 岁程序员,让我有所触动,30岁以上的程序员该何去何从?

最近面试了一个31岁8年经验的程序猿,让我有点感慨,大龄程序猿该何去何从。

大三实习生,字节跳动面经分享,已拿Offer

说实话,自己的算法,我一个不会,太难了吧

程序员垃圾简历长什么样?

已经连续五年参加大厂校招、社招的技术面试工作,简历看的不下于万份 这篇文章会用实例告诉你,什么是差的程序员简历! 疫情快要结束了,各个公司也都开始春招了,作为即将红遍大江南北的新晋UP主,那当然要为小伙伴们做点事(手动狗头)。 就在公众号里公开征简历,义务帮大家看,并一一点评。《启舰:春招在即,义务帮大家看看简历吧》 一石激起千层浪,三天收到两百多封简历。 花光了两个星期的所有空闲时...

《经典算法案例》01-08:如何使用质数设计扫雷(Minesweeper)游戏

我们都玩过Windows操作系统中的经典游戏扫雷(Minesweeper),如果把质数当作一颗雷,那么,表格中红色的数字哪些是雷(质数)?您能找出多少个呢?文中用列表的方式罗列了10000以内的自然数、质数(素数),6的倍数等,方便大家观察质数的分布规律及特性,以便对算法求解有指导意义。另外,判断质数是初学算法,理解算法重要性的一个非常好的案例。

《Oracle Java SE编程自学与面试指南》最佳学习路线图(2020最新版)

01、Java入门(Getting Started);02、集成开发环境(IDE);03、项目结构(Eclipse JavaProject);04、类和对象(Classes and Objects);05:词法结构(Lexical Structure);06:<em>数据</em>类<em>型</em>和变量(Data Type and Variables);07:运算符(Operators);08:控制流程语句(Control Flow Statements);

大牛都会用的IDEA调试技巧!!!

导读 前天面试了一个985高校的实习生,问了他平时用什么开发工具,他想也没想的说IDEA,于是我抛砖引玉的问了一下IDEA的调试用过吧,你说说怎么设置断点...

面试官:你连SSO都不懂,就别来面试了

大厂竟然要考我SSO,卧槽。

终于,月薪过5万了!

来看几个问题想不想月薪超过5万?想不想进入公司架构组?想不想成为项目组的负责人?想不想成为spring的高手,超越99%的对手?那么本文内容是你必须要掌握的。本文主要详解bean的生命...

我说我懂多线程,面试官立马给我发了offer

不小心拿了几个offer,有点烦

自从喜欢上了B站这12个UP主,我越来越觉得自己是个废柴了!

不怕告诉你,我自从喜欢上了这12个UP主,哔哩哔哩成为了我手机上最耗电的软件,几乎每天都会看,可是吧,看的越多,我就越觉得自己是个废柴,唉,老天不公啊,不信你看看…… 间接性踌躇满志,持续性混吃等死,都是因为你们……但是,自己的学习力在慢慢变强,这是不容忽视的,推荐给你们! 都说B站是个宝,可是有人不会挖啊,没事,今天咱挖好的送你一箩筐,首先啊,我在B站上最喜欢看这个家伙的视频了,为啥 ,咱撇...

代码注释如此沙雕,会玩还是你们程序员!

某站后端代码被“开源”,同时刷遍全网的,还有代码里的那些神注释。 我们这才知道,原来程序员个个都是段子手;这么多年来,我们也走过了他们的无数套路… 首先,产品经理,是永远永远吐槽不完的!网友的评论也非常扎心,说看这些代码就像在阅读程序员的日记,每一页都写满了对产品经理的恨。 然后,也要发出直击灵魂的质问:你是尊贵的付费大会员吗? 这不禁让人想起之前某音乐app的穷逼Vip,果然,穷逼在哪里都是...

前端还能这么玩?(女朋友生日,用前端写了一个好玩的送给了她,高兴坏了)

前端还能这么玩?(女朋友生日,用前端写了一个好玩的送给了她,高兴坏了)

成年人需要学会持续性学习

不知道你有没有这种感觉,刚出社会的年轻人,感觉就像一匹脱离缰绳的野马,是很兴奋,有很多的想法,同时这个阶段是稚嫩的,因为初入职场,什么都不懂,总归需要别人带一带。但是有的甚至已到中年,...

爬虫(101)爬点重口味的

小弟最近在学校无聊的很哪,浏览网页突然看到一张图片,都快流鼻血。。。然后小弟冥思苦想,得干一点有趣的事情python 爬虫库安装https://s.taobao.com/api?_ks...

在拼多多上班,是一种什么样的体验?我心态崩了呀!

之前有很多读者咨询我:武哥,在拼多多上班是一种什么样的体验?由于一直很忙,没抽出时间来和大家分享。上周末特地花点时间来写了一篇文章,跟大家分享一下拼多多的日常。 1. 倒时差的作息 可能很多小伙伴都听说了,拼多多加班很严重。这怎么说呢?作息上确实和其他公司有点区别,大家知道 996,那么自然也就能理解拼多多的“11 11 6”了。 所以当很多小伙伴早上出门时,他们是这样的: 我们是这样的: 当...

应聘3万的职位,有必要这么刁难我么。。。沙雕。。。

又一次被面试官带到坑里面了。面试官:springmvc用过么?我:用过啊,经常用呢面试官:springmvc中为什么需要用父子容器?我:嗯。。。没听明白你说的什么。面试官:就是contr...

太狠了,疫情期间面试,一个问题砍了我5000!

疫情期间找工作确实有点难度,想拿到满意的薪资,确实要点实力啊!面试官:Spring中的@Value用过么,介绍一下我:@Value可以标注在字段上面,可以将外部配置文件中的<em>数据</em>,比如可以...

自学编程的 6 个致命误区

嗨,小伙伴们大家好,我是沉默王二。本篇文章来和大家聊聊自学编程中的一些误区——这是我在 B 站上看了羊哥的一期视频后有感而发的文章。因为确实有很多读者也曾私信问过我这些方面的问题,很有代表性,所以我就结合自己的亲身体会来谈一谈,希望对小伙伴们有所启发。 01、追求时髦 所谓基础不牢,地动山摇啊。可很多小伙伴压根就没注意过这个问题,市面上出什么新鲜的技术就想去尝试,结果把自己学的乱七八糟,心灰意冷...

wordpress模板适合企业用下载

wordpress模板适合企业用 arras-theme.1.4.3.1.zip 相关下载链接:[url=//download.csdn.net/download/wazuta/2490064?utm_source=bbsseo]//download.csdn.net/download/wazuta/2490064?utm_source=bbsseo[/url]

Modbus_Simulator仿真软件使用说明下载

modbus仿真器的使用说明,方便大家使用 相关下载链接:[url=//download.csdn.net/download/meng1521/3916761?utm_source=bbsseo]//download.csdn.net/download/meng1521/3916761?utm_source=bbsseo[/url]

动物斑马PPT下载

动物PPT,图案是斑马,是您制作课件好帮手,你必须会使用OFFICE 相关下载链接:[url=//download.csdn.net/download/weixin_43340843/10702622?utm_source=bbsseo]//download.csdn.net/download/weixin_43340843/10702622?utm_source=bbsseo[/url]

我们是很有底线的