我想通过虚拟机的sparksql统计keyword共有几种类型的词及其数量,我先后用amount和number作为统计的列,以下是我试过并报错的代码
所以这个sparksql语句到底应该怎么改呢?
我想通过虚拟机的sparksql统计keyword共有几种类型的词及其数量,我先后用amount和number作为统计的列,以下是我试过并报错的代码
所以这个sparksql语句到底应该怎么改呢?
mismatched input 报错输入不匹配,
可能原因有以下两点:
①我发现你写的keyword列和统计列之前都没有用逗号分开,标准sql不是要求列名与列名之间用逗号隔开吗?
②count函数不需要指定列名吗?如果不指定,写*号啊
改成以下这样试试
SELECT 'keyword',count(*) as 'amount' from cars group by 'keywords'