在使用mysql時,有時需要查詢出某個字段不重復的記錄,雖然mysql提供有distinct這個關鍵字來過濾掉多餘的重復記錄隻保留一條,但往往隻用它來返回不重復記錄的條數,而不是用它來返回不重記錄的所有值。其原因是distinct隻能返回它的目標字段,而無法返回其它字段,這個問題讓我困擾瞭很久,用distinct不能解決的話,我隻有用二重循環查詢來解決,而這樣對於一個數據量非常大的站來說,無疑是會直接影響到效率的。所以我花瞭很多時間來研究這個問題,網上也查不到解決方案,期間把朋友拉來幫忙,結果是我們兩人都鬱悶瞭!
下面先來看看例子:
table
id name
1 a
2 b
3 c
4 c
5 b
庫結構大概這樣,這隻是一個簡單的例子,實際情況會復雜得多。
比如我想用一條語句查詢得到name不重復的所有數據,那就必須使用distinct去掉多餘的重復記錄。
select distinct name from table
得到的結果是:
name
a
b
c
好像達到效果瞭,可是,我想要得到的是id值呢?改一下查詢語句吧:
select distinct name, id from table
結果會是:
id name
1 a
2 b
3 c
4 c
5 b
distinct怎麼沒起作用?作用是起瞭的,不過他同時作用瞭兩個字段,也就是必須得id與name都相同的才會被排除……
我們再改改查詢語句:
select id, distinct name from table
很遺憾,除瞭錯誤信息你什麼也得不到,distinct必須放在開頭。難到不能把distinct放到where條件裡?能,照樣報錯。。。。。。。
很麻煩吧?確實,費盡心思都沒能解決這個問題。沒辦法,繼續找人問。
拉住公司裡一JAVA程序員,他給我演示瞭oracle裡使用distinct之後,也沒找到mysql裡的解決方案,最後下班之前他建議我試試group by。
試瞭半天,也不行,最後在mysql手冊裡找到一個用法,用group_concat(distinct name)配合group by name實現瞭我所需要的功能,興奮,天佑我也,趕快試試。
報錯。。。。。。。。。。。。鬱悶。。。。。。。連mysql手冊也跟我過不去,先給瞭我希望,然後又把我推向失望,好狠哪。。。。
再仔細一查,group_concat函數是4.1支持,暈,我4.0的。沒辦法,升級,升完級一試,成功。。。。。。
終於搞定瞭,不過這樣一來,又必須要求客戶也升級瞭。
突然靈機一閃,既然可以使用group_concat函數,那其它函數能行嗎?
趕緊用count函數一試,成功,我。。。。。。。想哭啊,費瞭這麼多工夫。。。。。。。。原來就這麼簡單……
現在將完整語句放出:
select *, count(distinct name) from table group by name
結果:
id name count(distinct name)
1 a 1
2 b 1
3 c 1
最後一項是多餘的,不用管就行瞭,目的達到。
唉,原來mysql這麼笨,輕輕一下就把他騙過去瞭,鬱悶也就我吧(對瞭,還有容容那傢夥),現在拿出來希望大傢不要被這問題折騰。
哦,對,再順便說一句,group by 必須放在 order by 和 limit之前,不然會報錯.
更鬱悶的事情發生瞭,在準備提交時容容發現,有更簡單的解決方法:
select id, name from table group by name
看來對mysql的瞭解還是太膚淺瞭,不怕被笑話,發出來讓大傢別犯同樣的錯誤。