Cypher实战

tech2023-12-21  77

目录

前言

CREATE创建节点并创建关系

创建多条关系

对已存在的节点创建关系

批量创建节点

关系的规范

使用MATCH进行条件匹配

多标签匹配

以路径的形式返回节点和边的关系

使用函数id / labels返回节点id和标签

使用DELETE删除指定的节点或者关系

使用SET更新属性或者标签

使用REMOVE删除指定的属性或者标签

使用MERGE避免重复插入节点

使用UNION / UNION ALL做联合查询

使用order by / skip / limit对查询结果做处理

使用distinct进行去重

使用is null和is not null判断属性是否存在

使用in和or做范围查询

使用case when做条件分支处理

使用字符串函数

使用数学函数

查看关系起点和终点,以及关系类型

创建/删除索引和约束

查看索引和约束

关系的条件查询

返回List

返回Map

尽量使用OPTIONAL MATCH

使用最短路径函数shortestPath

写在最后


前言

本文演示常见的Cypher操作,默认每个代码块对应一条Cypher语句,但为了展示多条Cypher之间的相关性,可能会将多条Cypher放到一个代码块中,并通过‘;’进行隔开。由于一个完整的Cypher中不用包含‘;’,所以实际执行时,请按照';'分割后逐条执行。

本文比较重点的文字部分通过阴影背景标注出来,所有代码均测试通过,Neo4j的版本为3.5.4,如果你的版本更高,那么肯定是兼容的。


CREATE创建节点并创建关系

1)方案1,以路径的形式进行创建。

CREATE (adam:User {name: 'Adam'})-[:FRIEND]->(pernilla:User {name: 'Pernilla'})-[:FRIEND]-> (david:User {name: 'David'}) return adam,david,pernilla

2)方案2,节点和关系平行创建。

CREATE (adam:User {name: 'Adam'}), (pernilla:User {name: 'Pernilla'}), (david:User {name: 'David'}), (adam)-[:FRIEND]->(pernilla), (pernilla)-[:FRIEND]->(david) return adam,david,pernilla

不管哪种方案,执行结果都是一样的。注意:

在create语句中,return子句不是必须的。 

如果使用了return子句,默认的,在仅返回节点的情况下,如果节点之间包含了关系,那么也会将关系一起返回。

创建多条关系

CREATE (andrew:User {name: 'Andrew'}), (peter:User {name: 'Peter'}), (andrew)-[:FRIEND]->(peter), (andrew)-[:BROTHER]->(peter) return andrew, peter

对已存在的节点创建关系

先查询出节点,后创建关系即可。

CREATE (tony:User {name: 'Tony'}), (hank:User {name: 'Hank'}) return tony, hank MATCH (tony:User {name: 'Tony'}), (hank:User {name: 'Hank'}) CREATE (tony)-[r:CUT_HAIR]->(hank) return tony, hank

批量创建节点

使用unwind,声明多个节点的集合,再执行create

UNWIND [{name:"Lisi"},{name:"Zhangsan"}] AS mynodes CREATE (n:Person) SET n = mynodes

关系的规范

关系的箭头可以是朝左,也可以是朝右,但不能既朝左又朝右。

创建关系时,不必指定别名,但必须指定方向,且必须指定关系类型。

如下,前三个是正确的,最后三个是错误的。

CREATE (tony:User {name: 'Tony'})-[r:CUT_HAIR]->(hank:User {name: 'Hank'}) return tony, hank; CREATE (tony:User {name: 'Tony'})<-[r:CUT_HAIR]-(hank:User {name: 'Hank'}) return tony, hank; CREATE (tony:User {name: 'Tony'})<-[:CUT_HAIR]-(hank:User {name: 'Hank'}) return tony, hank CREATE (tony:User {name: 'Tony'})<-[r:CUT_HAIR]->(hank:User {name: 'Hank'}) return tony, hank; CREATE (tony:User {name: 'Tony'})-[]->(hank:User {name: 'Hank'}) return tony, hank; CREATE (tony:User {name: 'Tony'})-[:]->(hank:User {name: 'Hank'}) return tony, hank

匹配关系时,可以不指定箭头,也可以不指定关系类型,甚至可以不指定别名。在不指定箭头的情况下,系统匹配任意方向的关系。在不指定类型的情况下,系统匹配任意类型的关系。

MATCH (tony:User {name: 'Tony'}) -[r]-(hank:User {name: 'Hank'}) return tony, hank

使用MATCH进行条件匹配

MATCH匹配可以通过标签内属性来筛选,也可以通过where来筛选。标签内属性筛选一定能够转成where筛选,但是where筛选不一定能够转成标签内属性筛选。

下面两组Cypher分别等价。

MATCH (stu:Student{name:'LiMing'}),(u:User{name:'LiMing'}) MATCH (u)<-[s:SAME_NAME{name: u.name}]-(stu) RETURN stu, u; MATCH (stu:Student),(u:User) WHERE stu.name ='LiMing' and u.name = 'LiMing' MATCH (u)<-[s:SAME_NAME{name: u.name}]-(stu) RETURN stu, u MATCH (book:Book{ id:123,title:"Neo4j Guide"}) return book; MATCH (book:Book) where book.id = 122 and title="Neo4j Guide" return book

下面的这个Cypher无法转成标签内属性筛选。

MATCH (stu:Student)-[s:SAME_NAME{name: u.name}]->(u:User) where stu.name = u.name return stu, u

多标签匹配

返回同时包含多个标签的节点,可以在节点中声明,也可以在where中声明。

match (n:Person:User) return n match (n) where n:Person:User return n

以路径的形式返回节点和边的关系

路径是节点和关系的组合

MATCH p = (stu:Student)-[s:SAME_NAME{name: u.name}]->(u:User) where stu.name = u.name return p

使用函数id / labels返回节点id和标签

Neo4j中,在没定义唯一约束的情况下,每次执行create,都会创建新的节点或者关系,但是节点或者关系的id始终是唯一的。通过id函数可以获取节点的唯一id,通过labels函数可以获取节点的所有标签。

创建两个同名的‘川普‘节点,以下Cypher执行两次,可以看出<id>是不同的

CREATE (u:User{name:'Trump'}) MATCH (u:User) where u.name='Trump' return id(u) id(u)318357 MATCH (u:User) where u.name='Trump' return labels(u) labels(u)["User"]["User"]

使用DELETE删除指定的节点或者关系

如果当前需要删除的节点和其它节点具有关系,那么必须先删除关系,然后才能删除节点。否则直接删除即可。

MATCH (u:User) where id(u)=318 delete u MATCH (stu:Student)-[s:SAME_NAME{name: u.name}]->(u:User) where id(s) = 443 delete s

使用SET更新属性或者标签

set不仅仅可以用来更新属性,也可以用来为节点新增一个不存在的属性,更重要的是它可以为已存在的节点添加新的标签。

create (book:Book{ id:123,title:"Neo4j Guide", price:119.5}) return book; match (book:Book{ id:123,title:"Neo4j Guide"}) set book.title='Neo4j Guide 2nd' return book

新增属性

match (book:Book{ id:123,title:"Neo4j Guide"}) where id(book)=317 set book.pages = 200 return book

set可以添加标签

create (u:User{name:"Mask"}) return u; match (u:User{name:"Mask"}) set u:User:Person

使用REMOVE删除指定的属性或者标签

不同于delete,remove仅仅可以删除属性或者标签

删除其中一条属性

match (book:Book{ id:123,title:"Neo4j Guide"}) remove book.price return book

删除其中一个标签

match(u:User{name:"Mask"}) remove u:Person

使用MERGE避免重复插入节点

merge类似于create,但是连续执行create操作会插入属性重复的节点,连续执行merge能够避免这个问题。

merge判重的依据是节点属性数量一致,值也一致,才认为重复。

例如重复执行下面一条语句,最终只会生成一个节点。

MERGE (gp2:GoogleProfile2{ Id: 201402,Name:"Nokia"})

但是如果执行了上述语句,再执行下面语句,会生成两个节点

MERGE (gp2:GoogleProfile2{ Id: 201402,Name:"Nokia",addr:"Beijing"})

使用UNION / UNION ALL做联合查询

UNION 的作用是将两个结果集的拼在一起。

使用UNION / UNION ALL时,列名必须一致,一般情况下必须使用 as 指定相同的列名,因为列名是前缀.属性名。

UNION可过滤重复记录, UNION ALL 不能过滤重复记录。

以下两个Cypher分别返回了48和20条记录。

match (m:Member) return m.m_name as name, m.m_age as age, m.m_addr as addr union all match (u:User) return u.name as name, u.age as age, u.addr as addr match (m:Member) return m.m_name as name, m.m_age as age, m.m_addr as addr union match (u:User) return u.name as name, u.age as age, u.addr as addr

使用order by / skip / limit对查询结果做处理

order by 默认按照升序(asc)排序,可指定为desc。如果一个match中没有order by,那么Neo4j默认按照节点的id升序排序。

skip 从起始位置开始忽略指定的记录数。

limit 限制返回的条数。

当这几个关键字同时存在时,优先级顺序为 order by > skip > limit。如:

match (m:Member) return m id(m)m.age331213643336720 match (m:Member) where m.age >= 20 return m order by m.age skip 1 limit 2 id(m)m.age3312136433

使用distinct进行去重

MATCH (a:User)-[]->(b:User) RETURN DISTINCT b.name b.name"herry""mask""Perter""Pernilla""David""Hank""Berlin""Donload""Peter""Tony"

使用is null和is not null判断属性是否存在

null表示不存在,Neo4j中不会存储null值的属性。

在没有使用optional match的情况下,属性的值不可能为null。

如果一个节点存在某个属性,那么这个属性的值必定不为null,所以 null 仅仅是用来判断属性是否存在的,并不是用来判断这个属性的值是否为null。

例如,查询Member中,没有city这个属性的节点:

match (m:Member) where m.city is null return m

使用in和or做范围查询

类似于MySQL,in 和 or 的用法一致,但在Neo4j中用[ ]来指定in的范围。

MATCH (n:Member) where n.name in ['jerry', 'Harvy'] or n.age = 21 RETURN n LIMIT 25

使用case when做条件分支处理

类似于MySQL的case when,可以根据不同的条件返回不同的结果,以达到if else的效果。

MATCH (n:Member) RETURN CASE n.name WHEN 'jerry' THEN 'j' WHEN 'mask' THEN 'm' ELSE 'who' END AS result

使用字符串函数

常见的字符串函数,如转大写,转小写,字符串截取。

match (u:User) return upper(u.name), lower(u.name), substring(u.name, 0,1)

使用数学函数

常见的数学函数,如求数量,求最大值,求最小值,求总和,求平均值。

match (u:User) return count(*), min(u.age), max(u.age), sum(u.age), avg(u.age)

查看关系起点和终点,以及关系类型

若以关系r为参数,则type(r)返回关系类型,startNode(r)返回关系起点,endNode(r)返回关系终点。

match (u1:User)-[f:FRIEND] ->(u2:User) return f, id(f), type(f), startNode(f), endNode(f)

创建/删除索引和约束

Neo4j也提供索引机制,类似于MySQL的索引,可以加快匹配过程,实际的生产环境中必须按照查询的属性建立索引。建立了索引,也会占用额外的磁盘空间。

约束(CONSTRAINT)和索引(INDEX)的关系:

约束也是索引,但索引不一定是约束。如果对某个属性创建了约束,那么无法再次对该属性创建索引。

Neo4j在3.x的版本创建索引时无法自定义索引名称,在4.x的版本中可以自定义索引名称,但索引名称必须唯一。

如果节点的某个属性创建了索引,那么使用该属性的查询不用显示声明即可走索引查询。

社区版Neo4j仅支持唯一约束 Unique node property constraints,即约束属性值必须唯一。

企业版Neo4j不仅支持唯一约束还支持属性非空约束,即通过EXISTS约束属性必须存在,包含三类:

Node property existence constraints 节点属性必须存在

Relationship property existence constraints 关系属性必须存在

Node key constraints 节点的属性必须存在,且属性的值必须唯一

创建/删除单属性索引:

CREATE INDEX ON :User(name) DROP INDEX ON :User(name)

 创建/删除多属性索引,即组合索引: 

CREATE INDEX ON :Person(name, age) DROP INDEX ON :Person(name, age)

创建/删除约束。

CREATE CONSTRAINT ON (u:Member) ASSERT u.name IS UNIQUE DROP CONSTRAINT ON (member:Member) ASSERT member.name IS UNIQUE

查看索引和约束

查看索引有两种方式:call db.indexes 和 :schema。前者会提供更加详细的信息,但通常情况下使用:schema就够了。

查看约束的方式:call db.constraints。

索引的状态state标识索引是否正常,如果是ONLINE意味着索引正常,如果是OFFLINE那么索引异常。异常状态下查询无法走索引。

如果某天你查询Neo4j的接口响应缓慢,优先检查索引是否存在,索引是否是ONLINE状态。

分别执行这三个函数,可以看出不同点

关系的条件查询

1)存在关系类型为ROOMATE或者BROTHER的节点组

match (u:User),(u1:User) where (u)-[:ROOMATE|BROTHER]-(u1) return u,u1

2)查询具有一条或者两条ROOMATE关系的节点

match (a:User)-[:ROOMATE*1..2]->(b:User) return a, b

3)指定查询具有两条ROOMATE关系的节点

match (a:User)-[:ROOMATE*2]->(b:User) return a, b

返回List

RETURN [x IN range(0,10) WHERE x % 2 = 0 | x^3] AS result result[0.0, 8.0, 64.0, 216.0, 512.0, 1000.0]

这段Cypher实际上是分两阶段执行,首先执行:

RETURN [x IN range(0,10) WHERE x % 2 = 0] AS result result[0, 2, 4, 6, 8, 10]

然后对集合中的每个元素取立方即可。

| 在List中的操作并不是 or 的意思,应该理解成Linux中的管道流更加合适。

返回Map

数据准备,执行以下Cypher

create (p:Person{name:"Martin Sheen"}); create (p:Person{name:"Charlie Sheen", realName:"Carlos Irwin Estévez"}); create (p:Movie{title:"Wall Street", year:1987}); create (p:Movie{title:"Red Dawn", year:1984}); create (p:Movie{title:"Apocalypse Now", year:1979}); match(p:Person{name:"Martin Sheen"}), (m:Movie{year:1987}) create (p)-[:ACTED_IN]->(m); match(p:Person{name:"Martin Sheen"}), (m:Movie{year:1979}) create (p)-[:ACTED_IN]->(m); match(p:Person{name:"Charlie Sheen"}), (m:Movie{year:1979}) create (p)-[:ACTED_IN]->(m); match(p:Person{name:"Charlie Sheen"}), (m:Movie{year:1987}) create (p)-[:ACTED_IN]->(m); match(p:Person{name:"Charlie Sheen"}), (m:Movie{year:1984}) create (p)-[:ACTED_IN]->(m);

1)现在统计Charlie Sheen所演出的电影列表

MATCH (actor:Person {name: 'Charlie Sheen'})-[:ACTED_IN]->(movie:Movie) RETURN actor { .name, .realName, movies: collect(movie { .title, .year })} actor { "name": "Charlie Sheen", "movies": [ { "title": "Red Dawn", "year": 1984 }, { "title": "Wall Street", "year": 1987 }, { "title": "Apocalypse Now", "year": 1979 } ], "realName": "Carlos Irwin Estévez" }

注意这种结构:a{.x, x1:y1},它表示创建一个map,.x表示取a自身的属性,x1表示自定义的key,y1往往是一种经过聚合运算的数据结构。

这个例子中 RETURN actor { .name, .realName, movies: collect(movie { .title, .year })},表示返回actor的name和realName属性,并返回

新的属性,键为movies,值为一个title和year组成的集合。

上面的Cypher通过with关键字转换成如下也可以实现一样的效果,with用来传递临时变量。

MATCH (actor:Person {name: 'Charlie Sheen'})-[:ACTED_IN]->(movie:Movie) WITH actor, collect(movie { .title, .year }) AS movies RETURN actor { .name, movies }

2)统计所有Person中出演过电影(Movie)的演员,及其出演的电影数量

MATCH (actor:Person)-[:ACTED_IN]->(movie:Movie) WITH actor, count(movie) AS nrOfMovies RETURN actor { .name, nrOfMovies } actor { "name": "Emil Eifrem", "nrOfMovies": 1 } { "name": "Hugo Weaving", "nrOfMovies": 5 } { "name": "Laurence Fishburne", "nrOfMovies": 3 }

尽量使用OPTIONAL MATCH

使用match,如果没有记录,会返回无记录,而添加optional match,如果无记录则会返回null,相当于SQL中的outer join。

optional match通常用于组合查询的场景中,如果组合查询的某个子句为无记录,而其它子句有记录,那么使用match只会返回无记录,但使用optional match就可以返回null和其他记录的组合结果。

执行以下Cypher,即使第二个MATCH中无记录,也会返回结果

MATCH (a:Movie { title: 'Wall Street' }) OPTIONAL MATCH (a)-[r:ACTS_IN]->() RETURN a.title, r a.titler"Wall Street"null

如果我们去掉OPTIONAL,则所有结果都不会返回

MATCH (a:Movie { title: 'Wall Street' }) MATCH (a)-[r:ACTS_IN]->() RETURN a.title, r

(no changes, no records)

使用最短路径函数shortestPath

shortestPath可以返回两个节点的最短路径。

例如有一些列如下的节点

现在需要返回Martin Sheen和Oliver Stone的最短路径,显然二者本身具有FRIEND关系,那么最短路径就是这个关系的路径。

Cypher如下, 其中[*..15]表示最多不超过15条边的路径。

MATCH (martin:Person { name: 'Martin Sheen' }),(oliver:Person { name: 'Oliver Stone' }), p = shortestPath((martin)-[*..15]-(oliver)) RETURN p

写在最后

本文虽然叫Cypher实战,但是只展示了Cypher的常见操作,将其理解成一篇笔记更加合适。实际上Cypher可以做更多,更复杂的操作,要深入理解并掌握透彻,官方文档才是最好的教材。我曾经花3天把Cypher操练手册看完并敲了一遍,那感觉才叫酸爽,但鉴于实际开发中用不了多少,还是会容易忘记。所以,持续学习才是硬道理。

最后,如果你的问题在我这里没有找到解决方案,或者有任何的想法,不妨在评论区留言,我们一起进步。

最新回复(0)