'將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法'

""將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

這樣,我們就可以把不同的控制算法表示為兩個超參數α,β。

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

這樣,我們就可以把不同的控制算法表示為兩個超參數α,β。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們這裡省略四種方法的超參數以及證明,有興趣的同學可以參見論文:

https://arxiv.org/abs/1908.01883

2.3 改進現有的算法

以Sublevel Safe Set算法為例我們在實驗過程中發現,SS在大部分時候都是表現最好的,但BF在安全閾值比較高的時候表現最好。我們就想能不能結合這兩種方法的優點,提出一種更好的算法?

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

這樣,我們就可以把不同的控制算法表示為兩個超參數α,β。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們這裡省略四種方法的超參數以及證明,有興趣的同學可以參見論文:

https://arxiv.org/abs/1908.01883

2.3 改進現有的算法

以Sublevel Safe Set算法為例我們在實驗過程中發現,SS在大部分時候都是表現最好的,但BF在安全閾值比較高的時候表現最好。我們就想能不能結合這兩種方法的優點,提出一種更好的算法?

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們分析了兩種算法的策略,發現BF的優勢是在安全閾值比較高的時候,機器人離危險非常遠的時候就會觸發控制輸入(系統判定進入危險狀態)。BF的控制輸入跟系統是否處於危險狀態無關,而是跟能量函數值相關的,在這種時候,BF給出的控制輸入是最小的,對系統的影響最小。而在安全閾值比較低的時候,其他方法觸發的頻率較低,而BF經常給出控制輸入影響機器人的效率。

因此,我們提出了一種新的方法Sublevel Safe Set。我們微調了SS的超參數,讓SS結合了BF的超參數,僅在危險狀態下給出與能量函數值相關的控制輸入。這種方法結合了這兩種方法的優點,並在評測平臺上證明了這一點。

三、評測平臺

雖然我們將現有的算法統一了起來,但我們很難根據他們的數學形式推測出他們在具體場景下的表現。這是因為數學模型僅僅描述了他們的應對策略,很難對多變的環境進行建模。因此我們需要搭建一個虛擬環境來評測各種算法在各種平臺上的表現,比如球模型、汽車模型、機械臂模型等。

而且一個評測平臺對於整個領域的發展具有正面意義,計算機視覺的發展很大程度上受益於各種評測平臺的發展。

我們使用python裡的panda3d搭建了仿真環境,在環境中建模了各種測試平臺,並實現了上述提到的幾種算法。

整個平臺已經開源,並且配備了詳細的文檔,感興趣的同學可以參見:

https://github.com/intelligent-control-lab/BIS

往期回顧

I

李夏:期望最大化注意力網絡EMANet詳解

II

邱震宇:拋開模型,探究文本自動摘要的本質

III

李勇:基於自監督學習的微表情特徵表達

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

這樣,我們就可以把不同的控制算法表示為兩個超參數α,β。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們這裡省略四種方法的超參數以及證明,有興趣的同學可以參見論文:

https://arxiv.org/abs/1908.01883

2.3 改進現有的算法

以Sublevel Safe Set算法為例我們在實驗過程中發現,SS在大部分時候都是表現最好的,但BF在安全閾值比較高的時候表現最好。我們就想能不能結合這兩種方法的優點,提出一種更好的算法?

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們分析了兩種算法的策略,發現BF的優勢是在安全閾值比較高的時候,機器人離危險非常遠的時候就會觸發控制輸入(系統判定進入危險狀態)。BF的控制輸入跟系統是否處於危險狀態無關,而是跟能量函數值相關的,在這種時候,BF給出的控制輸入是最小的,對系統的影響最小。而在安全閾值比較低的時候,其他方法觸發的頻率較低,而BF經常給出控制輸入影響機器人的效率。

因此,我們提出了一種新的方法Sublevel Safe Set。我們微調了SS的超參數,讓SS結合了BF的超參數,僅在危險狀態下給出與能量函數值相關的控制輸入。這種方法結合了這兩種方法的優點,並在評測平臺上證明了這一點。

三、評測平臺

雖然我們將現有的算法統一了起來,但我們很難根據他們的數學形式推測出他們在具體場景下的表現。這是因為數學模型僅僅描述了他們的應對策略,很難對多變的環境進行建模。因此我們需要搭建一個虛擬環境來評測各種算法在各種平臺上的表現,比如球模型、汽車模型、機械臂模型等。

而且一個評測平臺對於整個領域的發展具有正面意義,計算機視覺的發展很大程度上受益於各種評測平臺的發展。

我們使用python裡的panda3d搭建了仿真環境,在環境中建模了各種測試平臺,並實現了上述提到的幾種算法。

整個平臺已經開源,並且配備了詳細的文檔,感興趣的同學可以參見:

https://github.com/intelligent-control-lab/BIS

往期回顧

I

李夏:期望最大化注意力網絡EMANet詳解

II

邱震宇:拋開模型,探究文本自動摘要的本質

III

李勇:基於自監督學習的微表情特徵表達

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

這樣,我們就可以把不同的控制算法表示為兩個超參數α,β。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們這裡省略四種方法的超參數以及證明,有興趣的同學可以參見論文:

https://arxiv.org/abs/1908.01883

2.3 改進現有的算法

以Sublevel Safe Set算法為例我們在實驗過程中發現,SS在大部分時候都是表現最好的,但BF在安全閾值比較高的時候表現最好。我們就想能不能結合這兩種方法的優點,提出一種更好的算法?

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們分析了兩種算法的策略,發現BF的優勢是在安全閾值比較高的時候,機器人離危險非常遠的時候就會觸發控制輸入(系統判定進入危險狀態)。BF的控制輸入跟系統是否處於危險狀態無關,而是跟能量函數值相關的,在這種時候,BF給出的控制輸入是最小的,對系統的影響最小。而在安全閾值比較低的時候,其他方法觸發的頻率較低,而BF經常給出控制輸入影響機器人的效率。

因此,我們提出了一種新的方法Sublevel Safe Set。我們微調了SS的超參數,讓SS結合了BF的超參數,僅在危險狀態下給出與能量函數值相關的控制輸入。這種方法結合了這兩種方法的優點,並在評測平臺上證明了這一點。

三、評測平臺

雖然我們將現有的算法統一了起來,但我們很難根據他們的數學形式推測出他們在具體場景下的表現。這是因為數學模型僅僅描述了他們的應對策略,很難對多變的環境進行建模。因此我們需要搭建一個虛擬環境來評測各種算法在各種平臺上的表現,比如球模型、汽車模型、機械臂模型等。

而且一個評測平臺對於整個領域的發展具有正面意義,計算機視覺的發展很大程度上受益於各種評測平臺的發展。

我們使用python裡的panda3d搭建了仿真環境,在環境中建模了各種測試平臺,並實現了上述提到的幾種算法。

整個平臺已經開源,並且配備了詳細的文檔,感興趣的同學可以參見:

https://github.com/intelligent-control-lab/BIS

往期回顧

I

李夏:期望最大化注意力網絡EMANet詳解

II

邱震宇:拋開模型,探究文本自動摘要的本質

III

李勇:基於自監督學習的微表情特徵表達

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

來掃我呀

-The End-

將門是一家以專注於發掘、加速及投資技術驅動型創業公司的新型創投機構,旗下涵蓋將門創新服務、將門技術社群以及將門創投基金。將門成立於2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

將門創新服務專注於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。

將門技術社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門創投基金專注於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在三年的時間裡,將門創投基金已經投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數科技、迪英加科技等數十傢俱有高成長潛力的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我“門”:

bp@thejiangmen.com

"將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

內容來自將門機器人控制規劃社群

From: CMU Intelligent Control Lab

作者:魏天昊;編輯:T.R.

本文為新欄目——將門好聲音第8

作者是來自將門機器人控制規劃社群的群友、即將到CMU Intelligent Control Lab深造的魏天昊。本文中,他將分享近期的一篇工作,與前段時間的文章《英偉達提出安全力場為自動駕駛保駕護航》十分相關,感興趣的同學可以重溫回顧。

如果你也想與廣大群友分享自己的研究工作、文章觀點、出坑經驗,點擊閱讀原文填寫申請表單!只要內容合適,我"門"送你頭條出道!

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

安全生產重於泰山!在人工智能時代如何讓算法更好地輔助人類預防事故的發生,保障生命財產安全,一直是相關研究領域活躍的研究內容。今天來自CMU的魏天昊給出了自己的答案,提出了利用基於能量函數的安全控制算法來有效保障安全,實現優秀的安全控制。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

魏天昊,浙江大學本科畢業,CMU在職科研助理,導師為劉暢流教授。研究方向是自動駕駛、人機合作和機器人安全。

  • 論文鏈接:

https://arxiv.org/abs/1908.01883

  • 項目鏈接:

https://github.com/intelligent-control-lab/BIS

一、背景介紹

1.1 安全控制算法

其實安全控制算法在我們的生活中很常見,只是大家意識不到它的存在。比如現在的汽車很多都有防碰撞緊急制動系統或者自動巡航系統,當汽車具有碰撞趨勢的時候,就會自動減速。這其實就是一個安全控制算法最為簡單的應用。

安全控制算法通過傳感器收集的數據判斷當前系統是否處於安全狀態之中,當不安全時給出相應的控制信號,讓系統恢復到安全狀態。因此安全控制算法必須具有以下幾個特點:

1、足夠底層,不要求過多的環境信息;

2、實時反饋,運算速度足夠快;

3、數學上可證明的有效性,能夠有效保障安全。

1.2 能量函數安全控制算法的定義

能量函數安全控制算法有多種分類,其中最常見的一類就是基於能量函數的算法。能量函數的想法非常直觀,比如下圖:

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

先看最左邊的圖,我們的目標是讓機器人(藍色實心圓)從左下角出發,避開場地中間的三個障礙物,成功抵達右上角。那該如何規劃路線呢?如右下圖,我們借鑑重力勢能,把三個障礙物想象成三座小山。我們假設機器人是受重力引導在三維平面上移動,這樣機器人就很自然的避開了處於“高處”的三個障礙物,最終的路線如右上圖所示。

這就是最早的基於能量函數的安全控制算法——勢能場算法(Potential Field Method),因為該方法借鑑了重力勢能。計算平面上每個點的“海拔高度”的函數,被稱為勢能函數,後來因為方法的擴展,人們將這一類計算“高度”的方法統稱為能量函數,常用ϕ 表示。

1.3 基於能量函數的安全控制算法的分類

基於能量函數的安全控制算法有許多,他們的不同主要可以歸結為兩點:

1、能量函數的設計不同

2、應對同樣能量值時的策略不同

因為能量函數的設計主要取決於具體任務,而且不同方法對於能量函數沒有依賴性,我們接下來都假設他們使用同樣的能量函數,主要介紹他們策略的不同。這裡給大家介紹比較有代表性的四種:

Potential Field(PF)

Sliding Mode(SM)

Barrier Function(BF)

Safe Set(SS)

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

PF上面已經介紹過了,我們從SM開始。SM跟PF基本是一樣的,主要區別在於每次收到SM只有判斷系統處於危險狀態時(能量函數大於某一常量)才會干預原先的路線,而且會使用最大力度干預。比如在上面的例子中,一開始機器人直線朝目標前進,直到快到某個障礙物的半山腰了,這時候能量函數達到了100,系統進入危險狀態。此時,機器人會受到沿勢能方向,馬達最大扭力的控制輸入。

PF和SM給出的控制輸入都是沿著能量函數的梯度方向,而BF和SS給出的控制輸入則是根據能量函數對於時間的導數來決定的。簡單來說,PF和SM給出的控制輸入是沿梯度方向的輸入,而BF和SS給出的控制輸入是使得下一時刻的速度沿梯度方向的輸入,因此BF和SS能夠更快速地使系統回到安全狀態中來。

BF每次給出的控制輸入除了由對時間的導數決定以外,還由當前的能量值決定。如果當前比較能量值比較高(比較危險),則給出的控制輸入就會比較大,能量值較低時輸入就比較小。SS則類似SM,僅在能量值高於某常量時給出控制輸入。

二、數學框架

2.1 需要統一算法的原因

雖然有很多基於能量函數的安全控制算法,但是他們之間的聯繫和區別還是不太清晰。研究者提出算法時一般只說明自己算法的有效性,很少與其他算法進行比較。但現有算法之間具有明顯的相似性,我們想能不能提出一個數學框架,把現有的算法都統一起來,把他們表示為同一框架應用不同超參數後的結果?

如果我們能把現有算法統一起來,則我們可以通過調整超參數得到不同的算法,對於發現新算法具有指導意義。

2.2 統一現有的算法

為了統一現有的算法,我們先把控制輸入分解,分解為沿著梯度的方向和垂直於梯度的方向,Lgϕ 即能量函數的梯度。u0 是參考輸入,如果安全控制算法覺得當前系統安全,則會直接採用參考輸入。我們把平行於Lgϕ 的分量us 稱為安全分量,因為系統的安全性完全由這個分量決定。而垂直於Lgϕ 的分量ue稱為效率分量,因為在us 不變的情況下,我們可以通過調整ue 來提升系統的效率。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

這樣,我們就可以把不同的控制算法表示為兩個超參數α,β。

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們這裡省略四種方法的超參數以及證明,有興趣的同學可以參見論文:

https://arxiv.org/abs/1908.01883

2.3 改進現有的算法

以Sublevel Safe Set算法為例我們在實驗過程中發現,SS在大部分時候都是表現最好的,但BF在安全閾值比較高的時候表現最好。我們就想能不能結合這兩種方法的優點,提出一種更好的算法?

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

我們分析了兩種算法的策略,發現BF的優勢是在安全閾值比較高的時候,機器人離危險非常遠的時候就會觸發控制輸入(系統判定進入危險狀態)。BF的控制輸入跟系統是否處於危險狀態無關,而是跟能量函數值相關的,在這種時候,BF給出的控制輸入是最小的,對系統的影響最小。而在安全閾值比較低的時候,其他方法觸發的頻率較低,而BF經常給出控制輸入影響機器人的效率。

因此,我們提出了一種新的方法Sublevel Safe Set。我們微調了SS的超參數,讓SS結合了BF的超參數,僅在危險狀態下給出與能量函數值相關的控制輸入。這種方法結合了這兩種方法的優點,並在評測平臺上證明了這一點。

三、評測平臺

雖然我們將現有的算法統一了起來,但我們很難根據他們的數學形式推測出他們在具體場景下的表現。這是因為數學模型僅僅描述了他們的應對策略,很難對多變的環境進行建模。因此我們需要搭建一個虛擬環境來評測各種算法在各種平臺上的表現,比如球模型、汽車模型、機械臂模型等。

而且一個評測平臺對於整個領域的發展具有正面意義,計算機視覺的發展很大程度上受益於各種評測平臺的發展。

我們使用python裡的panda3d搭建了仿真環境,在環境中建模了各種測試平臺,並實現了上述提到的幾種算法。

整個平臺已經開源,並且配備了詳細的文檔,感興趣的同學可以參見:

https://github.com/intelligent-control-lab/BIS

往期回顧

I

李夏:期望最大化注意力網絡EMANet詳解

II

邱震宇:拋開模型,探究文本自動摘要的本質

III

李勇:基於自監督學習的微表情特徵表達

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

來掃我呀

-The End-

將門是一家以專注於發掘、加速及投資技術驅動型創業公司的新型創投機構,旗下涵蓋將門創新服務、將門技術社群以及將門創投基金。將門成立於2015年底,創始團隊由微軟創投在中國的創始團隊原班人馬構建而成,曾為微軟優選和深度孵化了126家創新的技術型創業公司。

將門創新服務專注於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。

將門技術社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門創投基金專注於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在三年的時間裡,將門創投基金已經投資了包括量化派、碼隆科技、禾賽科技、寬拓科技、杉數科技、迪英加科技等數十傢俱有高成長潛力的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我“門”:

bp@thejiangmen.com

將門好聲音 | 安全生產重於泰山!基於能量函數的安全控制算法

點擊右上角,把文章朋友圈

將門創投

讓創新獲得認可!

微信:thejiangmen

bp@thejiangmen.com

"

相關推薦

推薦中...