博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Linq之Distinct详解
阅读量:6123 次
发布时间:2019-06-21

本文共 5511 字,大约阅读时间需要 18 分钟。

经常逛我博客的人看到标题不要慌张,也不用揉眼睛,是的,这篇是关于C#的,不是以往的IOS、Nodejs、MongoDB,其实我有一个秘密没给大家说,我他妈之前是一.Net高级软件工程师(高级两个我想用红色标记,想想还是不能太高调,哈哈哈,低调低调)。不知道有没有人心里会问小伙怎么搞起C#了?我就自问自答一下:因为我又从ios做回C#了。有人问我从C#转ios,又从ios转C#,后悔不后悔?我想说:后悔是什么?英文单词是什么?好了闲话不说了,走起。今天主要是了解一个linq中的distinct.

前天在做批量数据导入新增时,要对数据进行有效性判断,其中还要去除重复,如果没出现linq的话可能会新声明一个临时对象集合,然后遍历原始数据判断把符合条件的数据添加到临时集合中,这在有了linq之后显得比较麻烦。

一、首先创建一个控制台应用程序,添加一个Person对象

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;namespace Compare{    public class Person    {        public string Name { get; set; }        public int Age { get; set; }        public Person(string name, int age)        {            this.Name = name;            this.Age = age;        }    }}

二、创建测试数据

创建了一个Name="ZhangSan"的Person对象,放入personList两次,然后personList又创建了几个Person对象,这几个Person对象中也有Name、Age都重复的。例如:"XiaoMing",26.

Person person = new Person("ZhangSan",26);            List
personList = new List
() { person, new Person("XiaoMing",25), new Person("CuiYanWei",25), new Person("XiaoMing",26), new Person("XiaoMing",25), new Person("LaoWang",26), new Person("XiaoMing",26), person };

三、测试

下面的代码中用了两种方式来选择不重复的数据。

List
defaultDistinctPersons = personList.Distinct().ToList
(); foreach (Person p in defaultDistinctPersons) { Console.WriteLine("Name:{0} Age:{1}",p.Name,p.Age); } Console.WriteLine("-----------------------------------------------------"); List
comparePersons = personList.Distinct(new PersonCompare()).ToList
(); foreach (Person p in comparePersons) { Console.WriteLine("Name:{0} Age:{1}", p.Name, p.Age); } Console.ReadLine();

在华丽分割线上面是使用默认的distinct,下面是通过集成IEqualityComparer接口。下面是实现接口的代码:

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;namespace Compare{    public class PersonCompare:IEqualityComparer
{ public bool Equals(Person x, Person y) { if (x == null || y == null) return false; return x.Name.Equals(y.Name) && x.Age == y.Age; } public int GetHashCode(Person obj) { return obj.GetHashCode(); } }}

在上面的代码中,继承IEqualityComparer接口,主要是实现了两个方法: bool Equals(T x, T y);int GetHashCode(T obj);可能即使实现了接口也不了解里面是怎么个原理,我们先看下运行结果。

从上面的运行结果可以看到,两个运行结果是一样的,还是有重复的数据:例如XiaoMing,26.两个都没去除重复,只有ZhangSan那两个去除重复了。是不是有实现接口多此一举的感觉。那为什么还要有这个接口还要实现它呢?其实要说下GetHashCode和Equals。

在说GetHashCode和Equals之前先了解下distinct(),这个方法Distinct 默认比较的是对象的引用,所以使用默认的distinct()方法是ZhangSan对象是过滤除去的,而XiaoMing,26是两个不同的对象,没有除去。

然后说下GetHashCode和Equals两个方法.

1.哈希码哈希代码是一个用于在相等测试过程中标识对象的数值。它还可以作为一个集合中的对象的索引。如果两个对象的 Equals 比较结果相等,则每个对象的 GetHashCode 方法都必须返回同一个值。 如果两个对象的比较结果不相等,这两个对象的 GetHashCode 方法不一定返回不同的值.

简而言之,如果你发现两个对象 GetHashCode() 的返回值相等,那么这两个对象就很可能是同一个对象;但如果返回值不相等,这两个对象一定不是同一个对象.

当GetHashCode可以直接分辨出不相等时,Equals就没必要调用了,而当GetHashCode返回相同结果时,Equals方法会被调用从而确保判断对象是否真的相等。所以,还是那句话:GetHashCode没必要一定把对象分辨得很清楚(况且它也不可能,一个int不可能代表所有的可能出现的值),有Equals在后面做保障。GetHashCode仅需要对对象进行快速判断。

上面的几句算是总结性的说明了两个方法的是怎么个路子,这也能解释出ZhangSan的重复去除,而其他的几个对象没有去重复的原因,ZhangSan那是一个对象,其他的虽然Name、Age相等,但不是同一个对象。

我们可以稍微改动下代码来验证上面的语句.在实现IEqualityComparer的接口类中打印出一些信息就能看明白

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;namespace Compare{    public class PersonCompare:IEqualityComparer
{ public bool Equals(Person x, Person y) { if (x == null || y == null) return false; Console.WriteLine("XName:{0} XAge:{1} XHashCode:{2} YName:{3} YAge:{4} YHashCode:{5}", x.Name, x.Age, x.GetHashCode(),y.Name,y.Age,y.GetHashCode()); return x.Name.Equals(y.Name) && x.Age == y.Age; } public int GetHashCode(Person obj) { Console.WriteLine("GetHashCode Name:{0} Age:{1} HashCode:{2}",obj.Name,obj.Age,obj.GetHashCode()); return obj.GetHashCode(); } }}

在GetHashCode中打印了对象的Name、Age和HashCode。可以看到HashCode只有ZhangSan的是相同的,在Equals方法中只打印出了ZhangSan的,还是因为上面的先判断HashCode,相等了再使用Equals判断。

我们再改动下实现IEqualityComparer的接口类

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;namespace Compare{    public class PersonCompare:IEqualityComparer
{ public bool Equals(Person x, Person y) { if (x == null || y == null) return false; Console.WriteLine("XName:{0} XAge:{1} XHashCode:{2} YName:{3} YAge:{4} YHashCode:{5}", x.Name, x.Age, x.GetHashCode(), y.Name, y.Age, y.GetHashCode()); return x.Name.Equals(y.Name) && x.Age == y.Age; } public int GetHashCode(Person obj) { //Console.WriteLine("GetHashCode Name:{0} Age:{1} HashCode:{2}",obj.Name,obj.Age,obj.GetHashCode()); //return obj.GetHashCode(); string s = string.Format("{0}_{1}",obj.Name,obj.Age); Console.WriteLine("Name:{0} Age:{1} HashCode:{2}",obj.Name,obj.Age, s.GetHashCode()); return s.GetHashCode(); } }}

根据上面的的代码和测试结果我们可以看到,GetHashCode执行了7次(7个对象),Equals执行了3次,因为ZhangSan,26和XiaoMing,25两个的哈希码是一样的就没有继续往下执行。

 

转载地址:http://dagka.baihongyu.com/

你可能感兴趣的文章
从无到有,WebService Apache Axis2初步实践
查看>>
任务调度(一)——jdk自带的Timer
查看>>
UIKit框架(15)PCH头文件
查看>>
整理看到的好的文档
查看>>
Linux磁盘管理和文件系统管理
查看>>
从一个
查看>>
MongoDB 第三周作业——用java操作MongoDB之删除数组中的元素
查看>>
三、基于802.1x+AD+NPS+DHCP动态下发VLAN配置 (第3篇、添加角色NPS并设置)
查看>>
Windows开启SNMP服务----Win7
查看>>
体重档案应用客户端源码
查看>>
在linux中添加ftp用户,以及修改FTP默认端口号
查看>>
N26-第一周作业
查看>>
4月11日中高项作业
查看>>
华为交换机AAA特性与思科ACS对接
查看>>
二:Unit 8
查看>>
TortoiseSVN客户端重新设置用户名和密码
查看>>
nagios邮件报警配置
查看>>
Java 生产条形码代码
查看>>
python web开发-flask连接sqlite数据库
查看>>
Zxing二维码扫描
查看>>