원격 마이크로파 센서 데이터를 이용한 교통 속도 예측을위한 장단기 기억 신경망

나는 최근에 원격 마이크로파 센서 데이터를 이용한 교통 속도 예측을위한 장단기 기억 신경망을주의 깊게 읽고 여기에 기사의 주요 내용과 느낌을 기록했습니다. 원래는 과제로 제출하고 싶었는데 선생님이 과제를 바꿔 주셔서 직접 블로그를 썼어요. 하하하. 기사를 재현하는 데 며칠이 걸렸지 만 어렵지 않습니다. 결과는 기본적으로 Ma의 결론과 동일합니다. 반복되는 기사를 쓸 시간이 있습니다.

1. 요약
신경망은 교통 예측에 널리 사용되며, 본 연구에서는 교통 예측에 LSTM NN (Long Short-Term Neural Network)을 처음으로 사용하여 비선형 동적 변화를 포착 할 수 있습니다. LSTM NN 모델은 기울기 하강 과정에서 기울기 소멸의 단점을 극복하므로 장기 종속 시계열 데이터에 대해 매우 우수한 성능을 보여줍니다. LSTM NN의 기능을 추가로 검증하기 위해 베이징에서 두 개의 마이크로파 감지기가 수집 한 데이터를 기반으로 실증적 연구를 수행했습니다. LSTM NN의 예측 효과를 기존 RNN 모델 및 기타 인기있는 매개 변수 및 비모수 모델과 비교 한 결과, 마지막으로 LSTM NN이 최고의 예측 정확도와 안정성을 달성 할 수 있음을 확인했습니다.

2. 소개
지능형 교통 시스템의 성공적인 적용은 교통 정보의 정확한 획득에 달려 있습니다. 이는 특히 고급 교통 관리 시스템 (ATMS) 및 고급 여행자 정보 시스템 (ATIS)에 해당됩니다. 가장 중요한 정보 중 하나는 미래의 교통 상황을 예측하는 것입니다. 미래의 교통 상황을 예측하면 여행자가 더 나은 경로 선택과 여행 계획을 세우는 데 도움이 될 수 있으며, 교통 전문가가 교통 혼잡을 완화하고 도로 안전을 개선하기위한 조치를 개발할 수 있도록 지원할 수도 있습니다.
현재 코일 데이터는 일반적으로 주행 시간과 교통량을 예측하는 데 사용되고, 영상 데이터는 실제 도로 속도를 구하는 데 사용되며 속도 예측을 위해 다른 데이터를 사용하는 연구는 거의 없습니다. 이동 시간과 비교할 때 GPS와 같은 도로 속도 매개 변수를 얻는 방법은 상대적으로 더 많습니다. 원격 트래픽 마이크로 웨이브 센서 (RTMS)는 설치 및 기타 이점을 위해 폐쇄 된 도로가 필요하지 않기 때문에 엔지니어링 실무에서 널리 사용되고 있습니다. 교통, 속도 및 점유 매개 변수를 수집 할 수 있습니다. RTMS 수집 속도 매개 변수의 정확도는 95 %에 달할 수 있습니다.
기존의 통계적 예측 방법에 비해 일부 인공 지능 방법이 점점 더 대중화되고 있으며, 특히 인공 지능 방법은 노이즈와 누락 된 데이터가있는 데이터 세트를 처리 할 때 기존 통계 방법보다 더 많은 이점이 있습니다. 신경망 (ANN)은 인공 지능 방법의 대표적인 대표자 중 하나입니다. 현재 예측에 사용되는 신경망에 대한 많은 연구가 진행되고 있으며, RNN 모델은 구조상 시공간 데이터 처리에 매우 적합하지만 두 가지 주요 문제가 있습니다. 1. RNN의 지연 시간 단계를 결정해야합니다. , RNN은 장기적인 데이터 의존성을 포착 할 수 없습니다. LSTM NN은 기존 RNN의 이러한 두 가지 단점을 극복하고 더 나은 예측 결과를 얻을 것으로 예상됩니다.
이 백서의 혁신은 주로 다음과 같은 세 가지 측면을 포함합니다. 1. LSTM NN이 처음으로 속도 예측에 사용됨 2.이 방법은 지연 시간 단계를 자동으로 결정할 수 있음 3. 기존 RNN 및 기존 통계 방법을 사용한 LSTM NN의 성능 비교.
이 글의 구조는 첫째, 교통 예측 연구를 검토하고, 둘째, LSTM NN의 구조를 소개하고, 셋째, 베이징 데이터를 활용 한 실증적 연구를 수행하고, LSTM NN과 기존 RNN 모델 (Time- 지연된 NN, Elman NN, 비선형 자기 회귀 NN), SVM, ARIMA, Kalman 필터 방법을 비교하고 마지막으로 결론, 논의 및 전망했습니다.

3. 문헌 검토
교통 흐름 예측은 파라 메트릭 방식과 비 파라 메트릭 방식으로 나눌 수있다.
3.1 매개 변수 방법
매개 변수 방법은 미리 모델을 결정한 다음 데이터를 사용하여 매개 변수를 보정하는 것을 의미합니다. 일반적인 매개 변수 방법에는 분석 모델과 매개 변수 보정 모델이 있으며, 분석 방법에서 매개 변수 계산은 BPR (Bureau of Public Roads) 기능과 같은 방정식으로 계산됩니다. 이동 시간은 필요한 용량 비율에 따라 계산됩니다. 그러나 매개 변수는 실제로 어느 정도의 임의성을 가지므로 방정식 계산을 통해 아주 좋은 매개 변수를 얻을 수 없어 불안정한 결과를 초래할 수 있습니다. 시뮬레이션 모델의 경우 교통 흐름의 기본 이론은 상태 매개 변수를 얻는 가장 고전적인 방법입니다. 이를 바탕으로 다이나믹 웨이브 모델, 분자 모델, 3 상 교통 흐름 모델 등 많은 개선 된 모델이 제안되었습니다. 이러한 분석은 내부 운영법과 트래픽 메커니즘을 더 잘 이해하는 데 도움이 될 수 있지만, 대부분의 모델은 매우 이상적인 가정과 제한된 데이터 지원을 포함합니다. 트래픽의 주체는 사람이고 사람은 뛰어난 이동성을 갖기 때문입니다. 따라서 메커니즘을 완전히 이해하는 것은 어렵습니다.
시계열 분석은 또한 모수 적 방법과 비모수 적 방법으로 나눌 수 있습니다. 가장 고전적인 매개 변수 방법은 ARIMA 모델입니다.
3.2
비모수 적 방법 비모수 적 방법의 모델 구조 및 매개 변수는 고정되어 있지 않습니다. 고전적 통계 모델과 인공 지능 모델이 가장 많이 사용되는 두 가지 모델입니다. 그 중에서 가장 일반적으로 사용되는 고전적인 용어 인 교통 매개 변수 예측 방법은 다음과 같습니다. .
3.2.1 칼만 필터
3.2.2 서포트 벡터 머신
3.2.3 인공 신경망
RNN (Recurrent Neural Network)이라는 특수한 유형의 인공 신경망이 있습니다. 구조적 특성이 시계열 데이터를 예측하는 데 매우 적합하기 때문에 기존 RNN 모델에는 구조가 다른 다음 RNN도 포함됩니다. (1) Elman Neural 네트워크, (2) 시간 지연 신경망, (3) 외인성 입력 (NARX) 신경망을 사용한 비선형 자기 회귀.
전통적인 RNN 모델은 우수한 예측 성능을 가지고 있지만 여전히 다음 두 가지 문제가 있습니다.
1. 전통적인 RNN 모델은 장시간 지연된 시계열 데이터를 훈련 할 수 없습니다.
2. 전통적인 RNN은 미리 지연 시간 단계를 설정해야하지만이 지연 시간 단계를 자동으로 얻기는 어렵습니다.

4. 장단기 기억 신경망 (LSTM NN)
본 기사에서 사용 된 LSTM NN 모델은 입력 계층, 순환 은닉 계층, 출력 계층으로 구성되어 있지만 기존 RNN 모델과 달리 모델의 기본 단위 메모리 블록입니다. 메모리 블록에는 메모리 유닛이 포함되어 있습니다. 메모리 유닛은 잊혀진 게이트, 입력 게이트, 출력 게이트로 구성되어 있습니다.이 게이트 유닛은 기울기 소실 문제를 어느 정도 해결하고 과거 정보의 전송 및 망각을 자동으로 제어 할 수도 있습니다. 따라서 LSTM NN은 기존 RNN의 단점을 어느 정도 해결합니다. 메모리 블록의 기본 구조는 아래 그림과 같습니다.
여기에 사진 설명 삽입
LSTM NN 모델 구조

V. 모델 개발
본 논문은 실증 연구를 위해 두 대의 마이크로파 감지기의 데이터를 선택하였으며, 두 대의 마이크로 웨이브 감지기는 방향이 반대이며 고속도로에 설치되어 있습니다. 데이터 기간은 2013 년 6 월 1 일부터 2013 년 6 월 30 일까지이며 수집 빈도는 2 분이며 수집 콘텐츠에는 트래픽, 공유 및 속도가 포함됩니다. 누락 된 데이터는 시간 차원에 인접한 데이터로 채워집니다. 이 기사에서는 처음 25 일을 학습 세트로 사용하고 마지막 5 일을 테스트 세트로 사용합니다.이 모델은 이전 속도 및 교통 데이터를 기반으로 다음 2 분 동안의 속도를 예측하는 데 사용됩니다. LSTM NN을 제외하고 다른 모델은 모두 지연 시간 단계와 다른 입력 조합을 변경하며 각 알고리즘은 무작위성을 줄이기 위해 10 번 실행됩니다.

6. 결과 및 비교
기존의 모든 RNN 모델은 입력 레이어 1 개, 히든 레이어 1 개, 출력 레이어 1 개 등 동일한 토폴로지를 유지합니다. 은닉층에는 10 개의 은닉 뉴런이 있습니다. SVM 모델의 경우 RBF (Radial Basis Function)가 매개 변수를 훈련하는 데 사용됩니다. ARIMA 모델의 매개 변수 p, d 및 q는 AIC 기준을 사용하여 결정됩니다. 칼만 필터 방법의 경우 노이즈 포인트는 가우스 분포로 가정됩니다.
LSTM NN은 입력 계층, 메모리 블록이있는 LSTM 계층 및 출력 계층으로 구성됩니다. 평균 절대 백분율 오차 (MAPE) 및 평균 제곱 오차 (MSE)는 다른 모델의 성능을 비교하기위한 지표로 선택되었습니다.
표 1과 표 2는 각 모델의 성능 비교를 보여줍니다. 이 표에 따르면 LSTM NN이 최상의 모델이며 LSTM NN 모델이 대부분의 경우 기존 RNN 모델 및 SVM 모델의 정확도를 최소 28 % 초과한다는 것을 알 수 있습니다. 그러나 Elman NN의 MAPE가 LSTM NN보다 나은 상황이 있지만,이 결과는 Elman NN이 LSTM NN보다 낫다는 것을 나타내지 않습니다. . 이 결과는 Kikuchi 및 Nakanishi의 결과와 일치합니다. Elman NN은 때때로 매우 성공적으로 학습하지 못합니다. NARX NN 모델은 다른 기존 RNN 모델보다 우수하지만 장점은 매우 적습니다. SVM 효과도 NARX NN 모델과 비교할 때 매우 우수하지만 SVM 조정은 시간과 노동 집약적입니다. 예측 효과 측면에서 Kalman 필터링 및 ARIMA 모델의 효과는 다른 모델보다 훨씬 나쁘며, 이는이 두 가지 방법에 의해 너무 많은 강력한 가정이 만들어 졌기 때문일 수 있습니다.
여기에 사진 설명 삽입

표 3과 4는 입력을 속도 및 트래픽 흐름으로 설정 한 후의 성능을 보여줍니다. 표 1 및 표 2의 결과와 유사하게 LSTM NN은 여전히 ​​다른 방법보다 우수합니다. 또한 속도와 트래픽 흐름이 모두 입력으로 사용되는 경우 그 효과는 입력으로 단일 기록 속도에 기인하지만 성능 향상은 분명하지 않습니다.
여기에 사진 설명 삽입

예측 효과를 더 연구하고, 2014 년 6 월 30 일 속도를 예측하고, NARX NN 모델의 예측 효과와 실제 속도를 아래와 같이 선 그래프로 그립니다. NARX NN은 미래의 속도를 과소 평가하는 경향이 있음을 알 수 있습니다. 학습 능력이 부족하기 때문일 수 있습니다.
여기에 사진 설명 삽입

위의 분석을 바탕으로 다음과 같은 세 가지 결론을 얻을 수 있습니다.
(1) 기존 RNN 모델의 경우 지연 시간 단계가 매우 중요하며 지연 시간 단계 매개 변수를 올바르게 설정하면 성능이 크게 향상 될 수 있습니다. LSTM은 지연 시간 단계를 자동으로 결정할 수 있으므로 효과가 최적입니다.
(2) NARX NN은 다른 기존 RNN 모델을 능가합니다 .NARX NN은 이전 입력과 추가 입력을 포함 할 수 있기 때문에 Elman NN 모델은 긴 학습 시간 및 가끔 학습 실패와 같은 문제가 발생하므로 적합하지 않습니다. 속도 예측 모델.
(3) SVM 모델은 비교적 좋은 예측 결과를 얻을 수 있지만 매개 변수 조정은 매우 시간과 노동 집약적입니다.

7. 결론
이 기사는 속도 예측을위한 새로운 LSTM NN 방법을 보여줍니다. LSTM NN은 시계열의 장기 상관 관계를 학습 할 수 있으며 지연 시간 단계를 자동으로 결정할 수 있습니다. 이것은 매우 유리하고 교통 매개 변수의 예측에 적합합니다. LSTM NN의 효과를 실증적으로 연구하기 위해 1 개월의 속도 데이터를 수집하고 처음 25 일을 훈련 세트로 사용하고 마지막 5 일을 테스트 세트로 사용했습니다. 또한 LSTM NN 모델과 비교하기 위해 토폴로지가 다른 3 개의 RNN 모델과 일부 다른 매개 변수 및 비 매개 변수 모델이 사용됩니다. 실험 결과 LSTM NN 모델의 정확도와 안정성이 다른 모델보다 우수하고 다음과 같은 세 가지 유용한 결과가 주로 얻어집니다.
(1) 지연 시간 단계가 증가할수록 속도 예측의 정확도가 증가합니다. 지연 시간 단계를 올바르게 설정하면 속도 예측의 정확도를 높일 수 있습니다. LSTM NN 모델은 지연 시간 단계를 결정하지 않고도 좋은 속도 예측 효과를 얻을 수 있습니다.
(2) NARX NN은 다른 기존 RNN 모델보다 더 나은 결과를 얻을 수 있으며, 학습 부족으로 인해 Elman NN은 불안정한 결과를 생성 할 수 있습니다.
(3) SVM은 시계열 데이터를 예측하는데도 매우 적합하며 좋은 예측 결과를 생성 할 수 있지만 매개 변수를 조정하는 데 많은 노력이 필요합니다.
향후 연구에서는 인접 차선의 속도를 추가 입력으로 사용하는 것과 같이 시공간 정보를 LSTM NN의 입력으로 사용하는 것을 고려할 수 있습니다. 또한 다양한 데이터 수집 수준이 예측 효과에 미치는 영향도 분석 할 수 있습니다. 히든 레이어의 깊이 증가와 같은 LSTM NN 모델의 개선 사항도 연구 방향으로 사용할 수 있습니다.

参考 文献 :
Ma X, Tao Z, Wang Y, et al. 원격 마이크로파 센서 데이터를 이용한 교통 속도 예측을위한 장단기 기억 신경망 [J]. 교통 연구 파트 C 신흥 기술, 2015, 54 : 187-197.

추천

출처blog.csdn.net/qq_39805362/article/details/105509203