问题遇到的现象和发生背景
java dataframe 有几列,就是用户的点击行为日志,userId,itemId,timestamp(点击时间),对这三列按照userId,timestamp排序,说实话是先按userId排序,然后userId固定,再对timestamp排序,请问怎么实现这个?
用代码块功能插入代码,请勿粘贴截图
ratings.sort("userId").sort("timestamp").show(33);
运行结果及报错内容
|movieId|rating| time|userId|
| 858| 4.0|956703932| 6040|
| 593| 5.0|956703954| 6040|
| 2384| 4.0|956703954| 6040|
| 1961| 4.0|956703977| 6040|
| 2019| 5.0|956703977| 6040|
| 573| 4.0|956704056| 6040|
| 1419| 3.0|956704056| 6040|
| 3505| 4.0|956704056| 6040|
| 213| 5.0|956704056| 6040|
| 3111| 5.0|956704056| 6040|
| 1734| 2.0|956704081| 6040|
| 919| 5.0|956704191| 6040|
| 912| 5.0|956704191| 6040|
| 2503| 5.0|956704191| 6040|
| 527| 5.0|956704219| 6040|
| 318| 4.0|956704257| 6040|
| 1252| 5.0|956704257| 6040|
| 649| 5.0|956704257| 6040|
| 3289| 5.0|956704305| 6040|
| 759| 5.0|956704448| 6040|
| 2858| 4.0|956704475| 6040|
| 2396| 3.0|956704475| 6040|
| 608| 4.0|956704475| 6040|
| 2028| 5.0|956704519| 6040|
| 326| 4.0|956704519| 6040|
| 1649| 5.0|956704519| 6040|
| 17| 3.0|956704584| 6040|
| 34| 4.0|956704584| 6040|
| 2762| 4.0|956704584| 6040|
| 246| 5.0|956704613| 6040|
| 2692| 4.0|956704656| 6040|
| 1617| 4.0|956704673| 6040|
| 300| 2.0|956704716| 6040|
only showing top 33 rows
我的解答思路和尝试过的方法
这个结果明显是不对的,不符合常理啊。