기본 정보 과학 튜토리얼에 대한 간략한 참고 사항

기초정보과학 튜토리얼

1. 정보과학의 경험적 규칙

핵심 지식 포인트:

  1. 브래드포드의 법칙: 저널 내 전문 논문 배포의 경험적 규칙성을 설명하는 법칙
  2. Lotka의 법칙: 저자와 논문 수 사이의 관계를 설명하는 경험적 규칙
  3. 지프의 법칙(Zif's Law): 문헌에서 단어와 단어의 출현 빈도 사이의 관계를 설명하는 경험적 법칙
  4. 문서 증가 법칙(Document Growth Law): 시간이 지남에 따라 문서 정보의 양이 증가하는 것을 설명하는 일련의 경험적 법칙
  5. 문서 노화의 법칙: 시간이 지남에 따라 문서 정보의 가치 하락을 설명하는 일련의 경험적 법칙

1.1 브래드포드의 법칙

브래드포드의 법칙(Bradford's Law)은 전문 논문이 저널에 게재되는 것을 설명하는 경험적 법칙입니다.

핵심 아이디어: 저널을 출판된 논문 수에 따라 내림차순으로 배열하면 핵심 영역과 연속된 여러 영역으로 나눌 수 있으며, 각 영역에서 출판된 논문 수가 동일할 때 핵심 저널 수와 주변 저널의 수는 다음과 같습니다: n c : n 1 : n 2 = 1: a : a 2 관계, 여기서 a는 브래드포드 상수라고 합니다.

주된 목적:

  • 저널 주문 및 저널 활용을 안내하는 핵심 저널 식별
  • 핵심 컬렉션 유지 관리, 핵심 검색 도구,
  • 단행본의 분포 조사

1.2 로트카의 법칙

로트카의 법칙(Lotka's Law)은 저자와 논문 수 사이의 관계를 설명하는 경험적 규칙입니다.

저자와 게재 논문 수 사이의 양적 법칙이 처음으로 밝혀졌습니다.

  • 물리학과 같은 분야의 저자와 논문 간의 관계는 기본적으로 역제곱의 법칙을 따릅니다.
  • 생물학, 컴퓨터, 공학 및 기타 분야는 역제곱 관계를 따르지 않습니다.

로트카의 법칙 확장:

  1. 가격의 법칙: 총 과학자 수는 뛰어난 과학자 수의 제곱이다
  2. 로트카 인포메트릭스

주된 목적:

  • 다양한 수의 논문을 출판한 저자 수와 특정 분야의 총 논문 수를 예측합니다.
  • 해당 분야의 저자 수를 기반으로 특정 분야의 관련 과학 논문 수를 추정합니다.

1.3 지프의 법칙

문학에서 단어와 단어의 출현 빈도 사이의 관계를 설명하는 경험적 규칙입니다. 자주 사용되는 단어는 실제 가치가 거의 없으며 전달하는 데 드는 노력을 절약할 뿐입니다.

주된 목적:

  • 가이드 문서 색인화, 어휘 편집 및 정보 검색
  • 단어 빈도가 적당하고 의미가 강한 단어를 색인어 및 검색어로 사용하는 자동 색인화

1.4 문학 성장의 법칙

시간이 지남에 따라 증가하는 문헌 정보의 양을 설명하는 일련의 경험적 법칙

관련 모델은 다음과 같습니다.

  • 지수 곡선
  • 물류 곡선
  • 레허 모델

1.5 문서 노화의 법칙

시간이 지남에 따라 문헌 정보의 가치가 감소하는 것을 설명하는 일련의 경험적 법칙입니다.

  • 음의 지수적 노화 모델
  • 버튼-케플러 방정식

예를 들어, 지구가 둥글다고 주장하는 논문이 1700년에 출판되었다고 가정해 보세요. 이 논문은 지구가 정사각형이라는 당시 대중적인 견해에 도전하는 새로운 관점을 제시했다는 점에서 당시 매우 가치가 있었습니다. 그러나 시간이 지나면서 사람들은 지구가 둥글지 않다는 사실을 점차 깨닫게 되었고, 이 논문의 결론은 더 이상 정확하거나 신뢰할 수 없게 되었습니다. 이는 문학의 늙어가는 법칙의 발현이며, 시간이 지날수록 문학의 결론과 가치는 계속해서 감소하게 된다.

2. 정보과학의 기초이론

핵심 지식 포인트:

  1. 지식 기반 이론(Brooks): 객관적인 지식을 정리하고 연구하며, 지식 지도
  2. 의사결정 시스템 이론(Jovitz): 지능은 컴퓨터 시뮬레이션을 실현할 수 있는 의사결정에 유용한 데이터입니다.
  3. 과학적 의사소통 이론(Mikhailov): 공식 의사소통, 비공식 의사소통
  4. 규범 이론(Lu Taihong): S(지능 소스에 대한 연구), C(지능 프로세스에 대한 연구), U(정보 사용자에 대한 연구)의 세 가지 주요 규범이 있으며 정량적 시스템은 확립되지 않았습니다.
  5. 원래 이론(Wang Chongde): 거시 참조 의미가 있음
  6. 스택 이론(옌이민): 정보 스택, 스택 통신, 제로 스택 통신

2.1 브룩스의 지식기반이론

  • 핵심 아이디어: 객관적인 지식을 정리하고 연구합니다.

  • 새로운 지식은 기존 지식에 새로운 지식을 더해 구성됩니다.

  • 지식 지도: 사람들의 창조와 사고의 상호 영향과 상호 연관된 노드를 찾아 지도처럼 표시하고 지식의 유기적 구조를 실제로 드러냅니다.

2.2 Jowitz의 의사결정 시스템 이론

  • 지능은 의사결정에 중요한 데이터입니다.

  • 정보과학의 연구대상은 ' 일반지능시스템 '이다.

  • 컴퓨터 시뮬레이션을 실현할 수 있는데, 이는 경험적 연구 측면에서 브룩스의 '지식 지도' 이론보다 우수합니다.

2.3 미하일로프의 과학적 의사소통 이론

  • 과학적 커뮤니케이션은 논쟁의 기본이며, 인류사회에서 과학정보를 제공, 전달, 획득하는 다양한 과정은 과학의 존재와 발전을 위한 기본 메커니즘이며, 이러한 과정의 총합을 과학적 커뮤니케이션이라고 한다.

  • 과학적 의사소통은 공식 의사소통과 비공식 의사소통으로 나누어진다.

    형식적 의사소통(간접 의사소통): 과학적 문서화 시스템을 통한 전달적 의사소통.

    ​ 장점: 검색 가능, 검증 가능, 인용 가능;

    단점: 지연.

    비공식적 의사소통(직접적 의사소통): 대인 의사소통, 개인적인 의사소통 등에 의존하는 의사소통.

    ​ 장점: 효율적이고 빠르며 간단합니다.

    단점: 검토가 어렵다.

특징적인 사고 학교:

  1. 물리학 모델: 사용자 사이의 과학 및 기술 정보 확산은 고체의 열 확산과 유사합니다(Auramescu, 1973).
  2. 생물학적 모델: 질병 전파에 대한 정보 교환 비유(Goffman, 1977).
  3. 사회학적 모델: 정보원(S)이 정보를 M(S)로 전송하고, 정보원이 가공한 정보산물은 M(R)이라고 가정하고, M(R)에 있는 특정 정보 I가 사용자를 만났을 때, 지식 이 있습니다 구조 K(1)을 가진 지능 사용자는 정보 I를 흡수 하고 그들의 지식 구조를 K(2)로 점프시킵니다(Wickley, 1987).

2.4 루타이홍의 규범이론

정보과학의 세 가지 연구 규범:

  • S 사양: 인텔리전스 소스 지향
  • C 사양: 수동적 절차 지향
  • U 사양: 사용자 중심

장점과 단점:

  • 장점: 정보 작업 및 정보 과학의 연구 초점을 강조합니다.

  • 단점: 정량적 시스템이 확립되어 있지 않음

2.5 왕충더(Wang Chongde)의 독창적 이론

  • 유사성 원칙
  • 소산구조의 원리
  • 매튜 효과
  • 최소 노력 원칙
  • 확률론적 과정 원리

장점과 단점:

  • 장점: 매크로 참조 중요성이 있음

  • 단점: 시스템 내부 원칙이 부족하고 구조가 너무 느슨함

2.6 Yan Yimin의 스택 이론

정보스택(Information stack) : 정보발신자(S)에서 정보수신자(R)로 정보가 흘러가는 링크, 즉 출판기관, 전달기관 등 인간 또는 인위적인 링크이다.

  1. 제로 스택 통신: S와 R이 직접 통신합니다.
  2. 스택 교환

장점과 단점:

  • 장점: 주제 경계를 넘나드는 연구 가능성

  • 단점: 정량적 지원에 대한 지원이 없으며 단지 모델 가설일 뿐입니다.

정보과학은 정보의 생성, 수집, 관리, 검색, 분석, 전송 및 활용을 연구하는 과학입니다.

정보과학의 세 가지 원칙:

  • 정보자원은 기본이다
  • 정보 전달이 핵심이다
  • 첩보가 목적이다

정보과학은 과학기술적 지향성을 갖고, 기록과학은 인문학적 지향성을 가지며, 도서관학은 사회과학 지향성을 갖는다.

3. 정보과학 방법론

핵심 지식 포인트:

  1. 2S2R 모델 : 주제선택(Select), 검색(Search), 조사(Research), 결과(Result)
  2. 일반적인 방법: 철학적 방법, 논리적 방법, 수학적 방법
  3. 주요 방법: 인용분석, 델파이 방법, 일반화된 이중 증거 방법

3.1 연구절차 및 학업기준

  • 2S2R 모델

연구 질문 정의: 연구 질문에 의해 형성된 검색 전략은 단일 데이터베이스에서 검색된 약 10개의 문서여야 합니다.

연구 가설 제시: 문제를 명확히 한 후, 문제 해결을 위해서는 다양한 가설과 해결책을 제시해야 합니다.

연구 방법 선택:

  • 어떤 문제를 해결하기 위해 어떤 방법이 사용됩니까?
  • 방법은 문제에 적합해야 합니다.
  • 새로운 접근방식을 입증해야 한다

정보과학은 사회과학으로, 정보과학 연구에서는 비간섭 경험적 증거를 위해 정량적 연구를 사용하는 경우가 많고, 간섭 경험적 증거를 위해 정성적 연구를 사용하는 경우가 많습니다.

  • 질적 연구와 양적 연구의 실제 적용

학문적 규범

  1. 엔터티 사양

  2. 정식 사양

    논문 표준 형식: 제목, 저자, 초록 및 키워드, 서론, 주요 논문, 결론, 감사의 글, 참고 문헌

    인용형식규격 : Harvard 시스템, Vancouver 시스템, Oxford 시스템, Chicago 시스템

통용 방법

철학적 방법

  1. 시스템 이론
  2. 사이버네틱스
  3. 정보 이론

논리적 방법

  1. 공제
  2. 유도

수학적 방법

  1. 수학적 분석
    • 논리적 추론을 엄격하게 따르는 상징적 분석 방법
    • 특징은 기호를 사용하여 변수를 나타내고 변수 간의 연관성을 찾는 것입니다.
    • 미분방정식, 적분변환, 행렬해석, 기하해석 등
  2. 통계 분석
    • 확률 이론에 기초
    • 부분적인 정보를 사용하여 전체를 추론(귀납적 추론)하지만 반드시 올바른 결론으로 ​​이어지는 것은 아닙니다.
    • 확률 이론의 역할은 얻은 정보를 최대한 활용하고 오류 확률을 줄이는 것입니다.

주요 방법

인용 분석

인용통계를 바탕으로 인용현상과 측정가능한 정보단위 간의 인용현상을 분석, 연구하여 정보의 정량적 특성과 내부법칙을 밝혀낸다.

  • 인용(Citing): 다른 문헌을 참고문헌으로 인용하는 것
  • 인용: 참고문헌에 나열된 것을 인용이라고 합니다.

주요 인물: 가필드

  • 저널 분석에 중점을 둔 ISI 시스템, 저널 영향력 지수
  • CWTS 시스템, 크라운 인덱스 CI
  • 상대적 측정을 사용하는 ISSRU 시스템

델파이 방식

  • 정해진 절차를 갖춘 전문가 조사 방식으로 익명성, 피드백, 통계의 3가지 특징을 갖고 있습니다.

설문조사 주관자는 문의양식을 작성하고, 정해진 절차에 따라 전문가그룹 구성원에게 서신을 통해 설문조사를 권유하고, 전문가그룹 구성원은 주최자의 피드백 자료를 통해 익명으로 의견을 교환한다. 여러 차례의 협의와 피드백, 전문가 의 의견을 점차적으로 집중하여 최종적으로 통계적으로 유의미한 집단적 판단 결과를 얻습니다.

관련방법 : 브레인스토밍 방법(전문가 회의 방법)

  • 회의 형식을 활용하여 전문가 간 상호 교류를 통해 지적 충돌을 촉진하고 아이디어의 불꽃을 펼칠 수 있도록 하여 전문가의 의견을 집중화하고 다듬을 수 있도록 합니다.

일반화된 이중 증거

동일한 문제에 대해 서로 다른 소스에서 얻은 두 가지 유형의 증거가 동일한 결론을 가리키거나 두 가지 방법을 사용하여 동일한 결과를 얻거나 실증적 테스트와 이론적 추론의 통일성이 허용되는 경우입니다. (예잉, 2017)

본질: 일관된 결론을 얻기 위해 두 가지 종류의 증거를 채택하거나 두 가지 방법을 채택하거나 두 가지 방법을 모두 채택하는 것은 "상대적 진실"을 발견하는 효과적인 방법입니다.

4. 인텔리전스 정보 출처

핵심 지식 포인트:

  1. 1차, 2차, 3차 문서
  2. 일반적인 문헌 정보 소스: 서적, 저널, 특허 문서, 논문 등
  3. OA: 공개 접근 정보 자원

4.1 문헌 및 정보 출처

  • 1차 문서 : 원본 문서, 최초로 가공하여 형성된 기록으로서 작성자의 가장 독창적인 생각, 데이터 등을 생산 활동에 반영한 것

  • 2차 문헌 : 1차 문헌을 일정한 방법에 따라 검색, 가공, 분류, 정제, 압축, 색인화하고, 그 외적 특성에 따라 정리하여 형성된 문서 형태.

    보조 문서는 기본 문서의 특성을 모아 놓은 것입니다.

  • 3차 문헌 : 2차 문헌을 활용하여 관련 1차 문헌을 검색을 통해 선별한 후 이를 분석, 합성, 가공하여 3차 통합문헌을 만드는 통합문헌.

  • 제로타임 문서: 비공식적으로 출판된 원본 문서 또는 비공식적으로 출판된 테스트 기록, 디자인 스케치 등의 문서.

엄밀히 말하면 정보 출처는 대부분 기본 문서입니다.

문헌 및 정보 정보의 상위 10개 소스:

  1. 서적
  2. 신문
  3. 특허 문서
  4. 표준문서
  5. 기술보고서
  6. 명제
  7. 회의 문서
  8. 정부 간행물
  9. 제품 샘플
  10. 아카이브

4.2 비문서적 정보원 정보원

4.2.1 전자 미디어 인텔리전스 정보 소스

  • 방송

  • 텔레비전

  • 회로망

    검색 엔진

    이메일

    소셜 네트워킹 사이트

4.2.2 언어지능 정보 출처

산발적인 정보 소스입니다.

  • 장점: 참신한 콘텐츠, 빠른 전달

  • 단점: 정보가 왜곡되기 쉽고, 정보 보유가 어렵고, 정보 전파 범위가 작음

4.2.3 물리적 지능 정보 소스

자연 물체와 인공 물체를 포함한 물리적 물체.

장점: 강한 직관력, 강한 객관성, 강한 실용성, 포괄적인 정보, 상대적으로 저렴한 비용.

단점: 정보의 수집, 전파, 저장이 어려우며, 지적재산권 분쟁을 일으키기 쉽다

4.2.4 기술수집

기술적 수집은 비문자적 정보를 수집, 처리 및 처리하는 프로세스입니다.

  • "측정 및 특성화 인텔리전스"라고도 함
  • 음향 지능, 적외선 지능, 레이저 지능, 핵 지능, 광학 지능 및 레이더 지능 등 다양한 특수 정보 소스 포함
  • 위의 수집 방법은 모두 1) 텍스트가 아닌 정보의 수집, 2) 특징의 수집, 3) 특징을 사람, 인물 또는 사물과 연결하고 사람, 인물 또는 사물의 상태 변화를 식별하는 통일된 주제를 가지고 있습니다.

4.2.5 오픈 액세스 정보 자원

OA: 오픈 액세스

  • OA 저널: 독자 액세스 비용을 청구하지 않는 자금 조달 모델로, 사용자는 인터넷을 사용하여 제한 없이 저널 기사 전문에 액세스할 수 있습니다.

  • OA 리포지토리: 학술 활동에서 발생하는 많은 비공식 정보를 쉽게 조회하고 활용할 수 없다는 문제에서 탄생한 것으로, 학문 분야에 개방된 주제 OA 리포지토리와 기관 전용 OA 리포지토리로 나눌 수 있습니다.

    주제 OA 창고: 그 안에 있는 문서는 전자 사전 인쇄 또는 사후 인쇄일 수 있습니다.

    기관 OA 창고(Institutional OA Warehouse): 대학이나 연구기관의 연구자들이 학술활동에서 생성한 다양한 학술정보를 모아놓은 기관도서관 또는 기관지식베이스

5. 정보조직

핵심 지식 포인트:

  1. 체계적 분류 : 문서의 내외적 특성에 대한 개념을 논리적으로 분류하고 체계적으로 정리한 것입니다.
  2. 조립 분류 방법: 카테고리 간 패싯 구조를 채택하고, 문서 내용을 여러 요소로 분석하고, 패싯에서 해당 클래스 코드를 찾은 다음 이를 완전한 분류 코드로 배열합니다.
  3. 시스템 조합 분류: 반다면 분류라고도 하며 시스템 분류에 더 가깝습니다.
  4. 주제방법(Topic method) : 문서의 주제를 직접적으로 나타내는 단어를 개념식별자로 사용하여 이를 하위순서로 정리하고, 참조체계를 통해 단어간의 관계를 드러내는 문서를 색인화하고 검색하는 방법
  5. 색인(Index) : 문서사항이나 지식단위를 기록하고 안내하는 검색도구로서 일정한 체계에 따라 정리되어 있다.
  6. 공통 DC 메타데이터
  7. 연결된 데이터: RDF 데이터 모델을 채택하고, URI를 사용하여 데이터 엔터티의 이름을 지정하고, 인스턴스 데이터와 클래스 데이터를 네트워크에 게시 및 배포하여 이러한 데이터가 HTTP를 통해 노출되고 획득될 수 있도록 합니다.
  8. 본체
  9. 시맨틱 웹

5.1 분류 구성 방법

5.1.1 시스템 분류

체계적 분류법(Systematic Taxonomy)은 계층적 분류법(Hierarchical Taxonomy), 열거형 분류법(Enumerative Taxonomy)이라고도 하며, 문서의 내부적 특징과 외부적 특징에 대한 개념을 논리적으로 분류하고 체계적으로 정리한 것이다.

핵심 아이디어: 모든 카테고리를 계층적 아키텍처로 구성합니다.

구조 : 주표, 복합표(부속표, 보조표), 설명 및 항목주, 색인

대표적인 대표자:

  1. 듀이 십진분류
  2. 의회 도서관 분류
  3. 국제특허분류
  4. 중국 도서관 분류

단점: 정보 구성 및 검색 요구 사항을 완전히 충족할 수 없습니다.

5.1.2 조합 분류 방법

조합된 분류법은 카테고리 간 패싯 구조를 채택하고, 문서의 내용을 여러 요소로 분석하고, 패싯에서 해당 클래스 코드를 찾아 이를 배열하고 결합하여 완전한 분류 코드를 만드는 것을 의미합니다.

시스템 분류와의 차이점:

  1. 시스템분류방법의 분류식별은 미리 정의되어 고정되어 있으며 분리가 불가능하고 부품의 위치도 변경할 수 없다.
  2. 조합분류의 분류표시는 고정이 아닌 결합, 분할이 가능하고, 다양한 부분의 위치가 변경될 수 있으며, 바퀴 배열을 지원하여 어떤 속성이나 특징에 따른 문서의 수집 및 검색이 가능하다. 여러 각도 문서의 목적.

대표적인 대표 : 대장 분류법

5.1.3 시스템 조합 분류 방법

반다면 분류 방법이라고도 알려진 시스템 조합 분류 방법은 시스템 분류 방법에 더 가깝습니다.

대표적인 대표자 : 국제십진분류

분류 색인화: 분류 검색 식별자를 형성하기 위해 문서 자원에 해당 클래스 번호를 할당하는 프로세스

자동 분류 클러스터링: 콘텐츠를 기반으로 사전 정의된 카테고리에 개체를 자동으로 할당합니다. 어휘 기반의 자동 분류와 훈련 세트 기반의 자동 분류로 나눌 수 있습니다.

5.2 테마 구성 방법

테마 정리 방법은 문서의 주제를 직접적으로 나타내는 단어를 개념 표시로 하여 문서를 색인화하고 검색하고, 이를 하위 순서로 정리한 후, 참조 체계를 통해 단어 간의 관계를 드러내는 방법을 말한다.

  • 제목 방법

    제목법은 표준화된 단어를 사용하여 문서의 주제를 색인화하고 이를 알파벳순으로 배열하는 방법이다.

  • 단위 어휘

    단위 단어를 주제 식별자로 사용하여 문자 조합을 통해 문서의 주제를 표현합니다.

  • 시소러스

    1. 서술자(Descriptor) : 조상을 표현하기 위해 자연어를 정제하고, 표준화하고, 기본 개념에 기초한 단어나 구를 말한다.

    2. 시소러스 방식(Thesaurus method): 통제된 자연어휘를 마커로 사용하고, 개념 조합을 통해 문학의 주제를 표현하는 주제별 방식의 일종.

    3. 대표적인 대표자 : "중국어 유의어 사전"

  • 키워드 방법

    기본적으로 단어의 표준화는 없습니다.

주제색인 : 문서의 주제를 분석하여 주제개념을 객관적이고 종합적이며 정확하게 추출하고, 특정 주제언어와 색인규칙에 따라 주제개념을 색인어로 변환하여 문서에 주제식별성을 부여하는 과정이다. 그 목적은 주제 검색 시스템을 구축하는 것입니다.

주요 과정:

  1. 표절 여부를 확인하세요
  2. 인덱싱 방법 선택
  3. 주제별 분석 수행
  4. 주제 개념을 주제 단어로 변환
  5. 사업 기록을 보관하세요
  6. 인덱싱 결과 검토

자동 색인 생성: 컴퓨터 시스템을 사용하여 저장되거나 검색된 문서에 검색 식별자를 할당하는 프로세스입니다.

5.3 색인화 및 추상화 방법

색인(Index) : 문서사항이나 지식단위를 기록하고 안내하는 검색도구로서 일정한 체계에 따라 정리되어 있다.

  • 색인
  • 콘텐츠 색인

주요 과정:

  1. 주제 선택 및 색인 방법 결정
  2. 문서 색인화 및 색인 항목 준비
  3. 설명

초록: 문헌의 주요 내용과 원자료를 간결하게 요약하고, 최신 연구 결과를 독자들에게 보고한다.

특징:

  • 대체 가능성
  • 객관성
  • 보고와 검색 모두

5.4 메타데이터

메타데이터는 데이터에 관한 데이터입니다.

  • 설명적 메타데이터
  • 관리 메타데이터
  • 애플리케이션 메타데이터

효과:

  1. 설명하다
  2. 위치
  3. 찾다
  4. 관리하다
  5. 평가하다
  6. 사용

DC 메타데이터:

  • 간단
  • 유연성
  • 확장성
  • 다재

RDF 자원 설명 프레임워크:

  • 호환성
  • 유연성
  • 단일성

5.5 연결된 데이터

RDF 데이터 모델을 채택하고 URI를 사용하여 데이터 엔터티의 이름을 지정하고 인스턴스 데이터와 클래스 데이터를 네트워크에 게시 및 배포하므로 이러한 데이터가 HTTP를 통해 공개되고 획득될 수 있습니다.

5.6 온톨로지와 시맨틱 웹

……

6. 정보 검색

핵심 지식 포인트:

  1. 정보 검색
  2. 클래식 검색 모델
  3. 텍스트 검색 기술
  4. 평가기준 : 재현율, 정밀도율
  5. 정보검색시스템 개발 동향

정보 검색에 관한 고전 서적:

  • "정보 검색 시스템 - 특성, 테스트 및 평가"
  • "전환: 상황에 맞는 정보 쿼리 및 검색 통합"

인텔리전스 검색 정의:

  • 좁은 의미에서의 정보 검색: "질의" 또는 "검색"이라는 단일 프로세스

  • 일반화된 정보 검색: 정보 저장과 검색의 두 가지 상호 프로세스를 포함하며 저장과 검색은 필수입니다.

정보 검색 시스템의 6가지 주요 하위 시스템:

  1. 문서 선택 하위 시스템
  2. 인덱싱 하위 시스템
  3. 어휘 하위 시스템
  4. 검색 하위 시스템
  5. 대화형 하위 시스템
  6. 일치하는 하위 시스템

기본 검색 모델:

  1. 부울 검색 모델
  2. 벡터 검색 모델
  3. 확률적 검색 모델

검색 시스템 설계 원칙

  1. 고효율 원리

    좋은 정렬 알고리즘

    질서정연한 세련미

    유사한 결과 제안

  2. 편의 원칙

    기본 검색

    고급 검색

    전문가 검색

문서 레이아웃 기술

  1. 줄을 서다
  2. 거꾸로 된

텍스트 인덱싱 기술

  1. 수동 인덱싱

  2. 인덱싱 깊이

    수동 검색 색인 깊이는 일반적으로 3(저자, 카테고리, 주제)에 도달합니다.

    자동 인덱싱은 모든 인덱싱 깊이에 도달할 수 있습니다.

  3. 자동 인덱싱

텍스트 검색 기술

  1. 부울 검색: AND OR NOT
  2. 잘림 및 와일드카드 검색: 잘림 전, 중간 잘림 및 잘림 후
  3. 정확한 구문 검색 및 퍼지 검색
  4. 현장 검색
  5. 위치 검색
  6. 대소문자 구분 검색
  7. 2차 검색

검색 전략 설계 포인트

검색 시스템 선택

  1. 가장 간단한 방법은 검색엔진을 이용해 시험검색을 해보는 것이고, 학술정보 검색을 위해서는 먼저 학술검색엔진을 사용해 볼 수 있다.
  2. 원문 직접 검색 방법: 필요한 정보가 매우 명확한 경우에는 출판사, 학회, 원문이 포함된 데이터베이스를 이용하여 직접 검색할 수 있습니다.
  3. 분야별 검색방법 : 전문분야별로 전문검색시스템이 있습니다
  4. 종합 검색 방법: Web of Science Core Collection, Scopus, CNKI, VIP, Wanfang 등 종합 검색 시스템
  5. 교차 데이터베이스 검색 방법: Web of Science 플랫폼, Google 학자 및 Baidu Scholar
  • 논리적 검색 공식화: 컴파일링 검색은 사용자가 검색 질문을 표현하는 논리적 표현을 말하며 컴퓨터 검색 시스템이 사용자 검색 요구를 식별하는 가교 역할도 합니다.

  • 피드백 및 조정 전략: 정보 검색은 일회성 프로세스가 아닙니다.

축소 전략:

  1. 검색 개념 추가

    "그리고"를 추가하세요

  2. 정확도를 높이는 몇 가지 검색 기술을 사용하세요.

    정확한 구문 검색, 필드 제한 검색, 위치 제한 검색

  3. 클러스터 검색 수행

    패싯 브라우징 기술

확장 전략:

  1. 테마 컨셉과 동일하거나 유사한 표현 추가

    통제된 주제 검색, 약어, 전체 이름 등

  2. 검색 주제 줄이기

    핵심이 아닌 테마 개념 제거

  3. 가족 검색 사용

    카테고리 검색을 사용하여 동일한 카테고리의 결과를 검색하세요.

  4. 제한된 검색의 사용을 줄입니다.

    정확한 구문 검색, 필드 제한 검색, 위치 제한 검색 등의 사용을 줄입니다.

지능 검색 평가

클래식 정보 검색 평가

  1. 회상률
  2. 정도
  3. 누락 감지율
  4. 오탐지율
  5. 응답 시간
  6. 사용자 부담
  7. 출력 표시

대화형 정보 검색 평가

  1. 배경 매개변수

    시스템 유형, 사용자 ID

  2. 상호작용 매개변수

    검색 질문 수, 검색 시간, 검색 브라우징 행동 등

  3. 성능 매개변수

    사용자가 완료한 작업의 양, 질, 시간 소모 등을 지원합니다.

  4. 편의 매개변수

    시스템의 편리성과 친근한 경험

OpenUrl: 규칙에 따라 공개 링크 URL을 동적으로 생성하고, 리소스 간의 일대일 및 일대다 적절한 링크를 실현하고, 보조 문서에서 기본 문서 리소스, 참조 리소스에서 원본 텍스트, 서지까지의 동적 링크를 효과적으로 해결합니다. 원본 텍스트 등에 대한 정보 질문.

메타데이터 웨어하우징 메커니즘: 분산된 이기종 리소스의 메타데이터를 수집 및 집계하여 로컬에 설치하고 통합 검색 및 서비스를 제공합니다.

메타 검색의 장점:

  1. 검색 범위가 넓다
  2. 데이터베이스 통제 대상이 아님
  3. 높은 회상
  4. 넓은 검색 범위
  5. 좋은 즉각성

결점:

  • 정확도가 높지 않음
  • 단일 데이터베이스 검색 플랫폼별 번역 구문과 검색문의 매칭 차이
  • 적중 결과를 크로스 플랫폼 검색 시스템의 디스플레이 인터페이스의 차이로 올바르게 구문 분석할 수 있는지 여부
  • 단일 데이터베이스별 검색 속도 차이로 인한 검색 결과 출력의 차이

정보검색시스템 개발 동향

  1. 언어 간 검색 기술
  2. 멀티미디어 검색 기술
  3. 시각화 기술
  4. 개인화 추천 기술
  5. 패싯 브라우징 기술
  6. 종합분석 기능

위 검색 기술의 통합 적용은 먼저 검색 엔진에 반영됩니다.

검색 엔진 기술의 향후 개발 동향:

  • 개인화하다

    사용자의 검색 행동을 추적 및 분석하고 이 정보를 사용하여 사용자의 검색 효율성을 향상시킵니다.

  • 지능적인

    1. 검색 요청 이해

    2. 웹 콘텐츠 분석

  • 전문화

    특정 산업, 특정 주제 및 특정 지역에 대한 정보를 수집하기 위해 특별히 설립되었습니다.

7. 지능 분석

  • 지능분석의 객관적 기반은 정보와 지식이다.
  • 지능 분석은 의사 결정 지원 범주에 속하며 의사 결정에 도움이 됩니다.

7.1 지능 분석의 원리

  1. 원본 정보의 가치: 고품질 원본 정보가 중요합니다.

  2. 정성적, 정량적 분석의 종합적 적용

    정량분석 : 분석모델 구축 및 해결에 중점을 두고 정량적 기반 제공

    정성적 분석 : 지능분석의 목적과 방향을 파악하고, 데이터를 파악하며, 분석지표 체계를 구축하고, 정량적 분석의 결과와 의의를 설명한다.

  3. 데이터 소스 및 처리 방법 공개: 분석 결론의 신뢰성 향상

  4. 신뢰성과 타당성이 통합됨

    신뢰성(Reliability): 분석 결과의 신뢰성

    유효성: 분석 결과의 정확성

7.2 지능 분석 과정

  1. 주제 선택

    a) 주제 제안: 명확한 목적, 의미 및 요구 사항

    b) 프로젝트 분석 및 시연: 프로젝트 타당성 시연

    다) 주제 선정 : 제안서 작성

  2. 설계

    a) 주제의 목적: 배경과 의의, 주요 이슈, 서비스 대상 및 혜택을 설명합니다.

    나) 연구개요 : 연구방법과 범위, 단계, 깊이와 폭 등을 명확히 한다.

    다) 연구 방법 및 기술 경로

    d) 예상 결과 형식: 연구 조건 및 사용자 요구 사항을 기반으로 결과의 수행 및 제출 형식을 기본적으로 명확히 합니다.

    e) 노동 및 예산의 조직적 분할: 지식 구조, 능력, 경험 및 전문 지식에 따라 특정 업무를 할당합니다.

    f) 구현 시간 및 단계: 예상 완료 시간 및 구현 단계는 여러 단계로 구분됩니다.

    g) 기타: 연구를 완료하는 데 필요한 소프트웨어 및 하드웨어 장비 조건 등

  3. 정보 수집

    문헌조사 및 사회조사

    a) 문헌 조사: 검색 방법을 활용

    나) 사회조사 : 현장조사, 면접조사, 설문조사, 표본조사 등

  4. 정보 처리

    a) 정보 정렬: 무질서에서 질서로의 조직적 과정

    b) 정보 평가: 신뢰성, 발전성, 적용성...

    c) 정보 수집 및 저장: 데이터베이스 구축

  5. 지능 분석 모델링

    기존 데이터를 잘 통합할 수 있는 적합한 분석 모델을 결정하는 방법은 분석 프로세스에서 매우 중요한 연결 고리입니다.

  6. 분석 결과 확인 및 결론 도출

  7. 조직 분석 연구 보고서

    지능 분석 보고서의 일반적인 구조는 다음과 같습니다.

    가) 주제

    나) 소개

    다) 텍스트

    d) 결론

    e) 참고문헌 및 부록

7.3 도메인별 인텔리전스 분석

  • 과학기술정보분석 : 과학연구논문을 중심으로 하는 정보분석의 가장 오래되고 가장 널리 발전된 분야
  • 기술정보분석 : 정보분석은 주로 특허정보자원을 연구대상으로 삼고 있으며, 이는 1950년대 미국에서 시작되었습니다.

과학 기술 지능 분석의 개발 :

  • 과학 문헌, 특허 정보 및 기타 정보 자원을 통합하여 다중 소스 데이터에 대한 과학 기술 지능 분석을 형성합니다.
  • 예: 과학과 기술의 전환 속도에 대한 연구 수행, 정부 과학 연구 의사 결정을 위한 지능 분석 결과 제공

사회과학 정보분석 : 인문사회과학 분야의 정보자원을 활용하여 인문사회과학 분야에 특화된 정보분석 및 서비스를 제공합니다.

  • 대체 측정 방법: 학업 성취도를 분석하고 설명하기 위한 소셜 네트워크 기반의 새로운 측정 지표

경쟁지능 분석(Competitive Intelligence Analysis) : 체계적인 접근을 통해 정보를 지식, 지능, 전략으로 변환하는 과정

경쟁 인텔리전스: 경쟁 환경, 경쟁자 및 경쟁 전략에 대한 정보 및 연구

경쟁 정보의 역할:

  1. 인식 및 조기 경고
  2. 의사결정 최적화
  3. 연구 참고자료

SWOT 분석: 내부 강점, 내부 약점, 외부 기회, 외부 위협

a) 환경요인 조사 및 분석

b) SWOT 매트릭스 구축

다) 행동대책 도출 및 행동계획 수립

7.4 지능분석업무의 종류

(1) 추적정보 분석

인텔리전스 모니터링, 인텔리전스 추적, 동적 모니터링 및 동적 추적이라고도 알려져 있으며 가장 일반적으로 사용되는 기본적이며 시간 효율적인 인텔리전스 분석 및 보고 형식입니다.

참고 사항:

  1. 추적 대상을 명확히 하세요.
  2. 분석 및 처리를 잘 수행하십시오.
  3. 적시에 보고서 전달

방법:

  • 수동 추적 인텔리전스 분석

  • 자동화된 추적 인텔리전스 분석

  • 수작업과 자동화의 결합

    첫째, 자동화 기술의 검색 효율성과 탐지율을 최대한 활용한 다음, 인공지능 분석의 장점을 정확하게 활용하여 지능 정보를 추가로 선별해야 합니다.

결과 및 보고서:

  1. 트래킹 익스프레스
  2. 추적 분석 보고서
  3. 추적 데이터베이스

일반적인 경우: "기술 참조"

(2) 평가지능분석

평가지능분석은 특정 주제를 목표로 하고, 특정 연구방법을 선택하고, 특정 분석 도구를 최대한 활용하며, 다양한 정보채널로부터의 지능을 분석, 요약, 정제, 비교, 평가하는 핵심 지능분석 업무입니다.

방법: 사실 데이터 + 특별한 도구 및 방법 + 전문가의 지혜

(3) 예측지능 분석

예측지능분석은 연구대상에 대해 이미 알려진 방대한 양의 정보를 바탕으로 특정 과학적 방법과 분석도구를 사용하여 연구대상의 발전 전망과 그것이 국가 경제 및 사회 발전에 미칠 수 있는 영향을 분석하고 예측하는 결과입니다.

알려진 것에서 알려지지 않은 것을 추론하는 분석 방법

방법:

  1. 시계열 외삽법 기반 : 과거 데이터에 의존하며 장기적인 추세 분석은 신뢰할 수 없습니다.
  2. 모델 클래스 메소드
  3. 전문가 의견 및 시나리오 분석 방법 : 널리 인정되고 적용되지만 비용과 시간이 많이 소요되며 일반적으로 대규모 국가 수준의 기술 예측 활동에만 적용 가능

7.5 빅데이터 시대의 지능분석 발전

빅 데이터로 인해 발생하는 과제:

  1. 지능분석의 기본이론과 방법체계 혁신에 새로운 도전
  2. 전통적인 정보 분석 및 처리 기술을 빅데이터의 관리 및 활용에 성공적으로 접목하는 방법
  3. 빅데이터는 새로운 시대의 과학기술 지능작업에 대한 새로운 연구 패러다임을 불러일으켰습니다.

연결하다:

  1. 빅데이터 분석은 지능분석과 자연스럽게 연결되어 지능분석의 특성과 장점을 더욱 잘 활용할 수 있습니다.
  2. 모든 연구는 데이터를 기반으로 합니다.
  3. 빅데이터의 가치사슬은 전통적인 지능작업의 가치사슬과 일치하며 , 지능분석의 "사실적 데이터 + 특수 도구 방법 + 전문가의 지혜"라는 방법론과 매우 일치합니다.
  4. 빅데이터는 인텔리전스 분석 데이터 소스를 풍부하게 할 수 있으며, 빅데이터 분석 기술 및 도구는 인텔리전스 분석 및 데이터 처리 기능을 효과적으로 향상시킬 수 있습니다.
  5. 빅데이터 분석 기술과 도구를 활용하면 지능분석 제품의 품질을 향상시키고 .

8. 정보기술

8.1 데이터베이스 및 데이터 웨어하우스 기술

데이터 관리 개발 단계

  1. 수동 관리 단계: 데이터의 전산 처리 단계

    먼저 컴퓨터에 프로그램과 데이터를 입력하고 컴퓨터가 실행된 후 결과를 출력하는데, 컴퓨터는 데이터를 직접 저장하지 않으며, 데이터를 관리하는 소프트웨어 시스템도 없고 수동으로 처리하므로 비효율적이다.

  2. 파일 시스템 단계: 파일 관리 시스템의 출현

    파일 관리 시스템을 통해 데이터를 컴퓨터에 장기간 저장할 수 있으며, 특정 액세스 방법을 통해 프로그램과 파일 내 데이터 간의 상호 변환이 완료될 수 있습니다. 높은 데이터 중복성, 빈약한 공유, 데이터 업데이트 동기화 유지 불가능, 데이터와 프로그램 간의 독립성 부족 등의 단점이 있습니다.

  3. 데이터베이스 시스템 단계

    데이터베이스 시스템은 데이터와 프로그램 간의 유기적인 연결을 구축하고, 데이터의 통합, 중앙 집중화, 독립적 관리를 실현하며, 데이터를 사용하는 응용 프로그램과 독립적으로 데이터 액세스를 가능하게 하고 데이터 공유를 실현합니다.

데이터 모델

  • 계층적 모델: 트리 구조 사용
  • 메쉬 모델: 방향성이 없으며 쿼리는 모든 노드에서 시작할 수 있으며 어느 방향으로도 수행할 수 있으며 높은 액세스 효율성과 우수한 성능을 제공하지만 구조가 복잡합니다.
  • 관계형 모델: 특정 조건을 충족하는 2차원 테이블을 통해 엔터티 컬렉션과 데이터 간의 관계를 나타내는 데이터 모델입니다. 대부분의 상용 데이터베이스는 이 모델을 사용합니다.
  • 개체 모델: 관계형 모델의 많은 장점을 계승하고 멀티미디어 데이터도 처리할 수 있으며 개체 지향 설계를 지원합니다.

일반적으로 사용되는 데이터베이스 관리 시스템

  • 입장
  • 신탁
  • SQL 서버
  • DB2

데이터 웨어하우스: 주제 중심적이고 통합적이며 안정적이고 시간에 따라 변하는 데이터 모음입니다.

조직 구조:

  1. 현재 상세 데이터 레이어
  2. 과거 세부정보 데이터
  3. 가벼운 종합 데이터
  4. 매우 포괄적인 데이터
  5. 메타데이터

온라인 분석 처리(OALP)

8.2 데이터 마이닝

  • 데이터 마이닝(Data Mining) : 방대한 양의 데이터에서 유용한 정보와 지식을 추출하는 과정
  • 연관성 분석: 대량의 데이터 속에 숨겨진 아이템 세트 의 빈도 패턴과 아이템 세트 간의 관계
  • 분류: 모델 예측 클래스를 사용하여 알 수 없는 개체 클래스에 레이블을 지정하는 동시에 데이터 클래스 또는 개념을 설명하고 구별하는 모델을 찾습니다.
  • 클러스터링: 데이터 개체를 여러 클래스 또는 클러스터로 그룹화
  • 편차 감지: 데이터 개체는 데이터의 일반적인 동작이나 모델과 일치하지 않습니다. 이러한 데이터 개체는 이상치라고도 하는 편차입니다.
  • 시계열 진화 분석: 시간에 따른 시간 변화 또는 개체 동작의 규칙이나 추세를 설명합니다.

데이터 마이닝 방법

  • 통계분석 방법
  • 의사결정 트리 방법
  • 대략적인 설정 방법
  • 신경망 접근법
  • 유전자 알고리즘

텍스트 마이닝(Text Mining): 대량의 텍스트 데이터에서 이전에 알려지지 않았고 유용하며 이해 가능한 지식을 추출하는 프로세스

빅 데이터: 수집, 저장, 연관 및 분석 측면에서 기존 데이터베이스 소프트웨어 도구의 기능을 크게 초과할 정도로 규모가 큰 데이터 세트를 빅 데이터라고 합니다.

빅데이터의 특징:

  1. 엄청난
  2. 다양성
  3. 고속
  4. 낮은 가치

빅데이터의 본질은 정보를 분석할 때 표본분석에서 종합분석으로, 정밀분석에서 근사분석으로, 인과분석에서 상관관계 분석으로 사고와 방법의 전환에 있습니다.

빅 데이터 처리 기술 및 도구:

  • 맵리듀스
  • 하둡

8.4 정보지원기술

(1) 멀티미디어 기술의 핵심 기술:

  • 데이터 압축 기술
  • 멀티미디어 인터랙티브 기술
  • 멀티미디어 정보 검색 기술
  • 대용량 저장 기술

(2) 정보 보안 기술:

  • 안티 바이러스 기술
  • 방화벽 기술
  • 암호화 기술
  • 디지털 워터마크 기술

(3) 기타 지원 기술: 시각화 기술, 지식 다이어그램 기술 등

9. 사용자 행동 및 인텔리전스 서비스

9.1 사용자 중심

"사용자 중심": 사용자 요구를 기준으로 충족하고 사용자 만족을 궁극적인 목표로 삼는 인텔리전스 서비스입니다.

4가지 수준:

  1. 프리젠테이션 레이어: 인터페이스 디자인 및 요소 최적화 디자인
  2. 구조적 계층: 정보자원의 배치 및 배열
  3. 콘텐츠 레이어: 서비스 콘텐츠의 타당성
  4. 전략적 계층: 정보기관의 서비스 목표 및 서비스 대상

서비스 모드:

  • 맞춤형 서비스

    a) 경쟁 인텔리전스 서비스: 사용자 모델링, 인텔리전스 자원의 개인화된 표현, 경쟁 인텔리전스 푸시

    나) 과학기술 신규 검색 서비스 : 주제정보서비스, 특별주제정보서비스

    다) 도서 추천 서비스 : 개인별 필요에 따른 도서 추천 제공

  • 임베디드 서비스

    a) 임베디드 참고자원 서비스: 사용자의 정확한 위치를 파악하고 특별한 요구에 따라 다양한 참고컨설팅 서비스 방법을 사용합니다.

    b) 내장된 과학 연구 지원 서비스: 새로운 연구 방향 추천, 데이터 마이닝 및 지원 등

    c) 임베디드 지식 검색 서비스: 지식 그래프를 사용하여 복잡한 현상을 밝힙니다.

9.2 정보 요구와 행동 모델

정보 요구는 정보에 대한 사람들의 불만에서 발생하며 인간의 정보 행동의 전제 조건이기도 합니다.

  • 방법론적 모델 : 철학적 관점에서 전체 정보추구 행위를 이해하기 위한 추상적인 틀

  • Krikelas의 정보 탐색 행동 모델 : 불확실성의 역할을 강조하며, 사람들은 자신이 불확실한 상태에 있음을 깨닫고 이 상태를 허용 가능한 수준으로 낮추려고 노력하기 때문에 정보를 추구한다고 믿습니다.

  • 베이츠의 정보 검색 모드 모델 : 정보 요구 사항은 동적으로 진화합니다. 진화 검색은 열매를 따는 "한 번에 한 지점" 모드를 정확하게 찾습니다.

  • Ellis의 정보 탐색 행동 모델 : 시작, 연결, 탐색, 식별, 추적, 추출, 검증, 종료.

  • Kuhlthau의 정보 탐색 프로세스 모델 : 정신 수준의 의미 탐색 프로세스(시작, 선택, 탐색, 형성, 수집, 보고)

  • 윌슨(Wilson)의 정보행태 모형 : 정보탐색행동은 정보사용자가 정보요구를 인지하기 때문에 발생하며, 사용자는 이러한 요구를 충족시키기 위해 공식적 또는 비공식적 정보원이나 정보서비스에 의존하게 되며, 이는 관련 정보를 얻는데 성공할 수도 있고 실패할 수도 있다.

연구 방법:

  1. 설문지 방법: 장점은 폭이 넓다는 것입니다.
  2. 면접방식 : 장점은 깊이에 있다
  3. 포커스 그룹 방식: 참가자 간의 역동적인 상호 작용에 초점을 맞춥니다.
  4. 일기 방식: 동적이고 쉽게 변화하는 정보와 감지하기 어려운 일부 숨겨진 정보를 캡처하는 데 적합합니다.
  5. 실험방법
  6. 내용 분석
  7. 메타분석
  8. 관찰 방법: 결과보다는 행동의 과정을 강조

9.3 최신 정보 서비스 콘텐츠 시스템

9.3.1 과학기술정보서비스

과학기술정보서비스의 발전 이력:

  1. 문서배달부터 정보서비스까지
  2. 정보서비스에서 지식서비스로
  3. 지식 서비스에서 지능형 서비스로

과학기술 정보 서비스 내용:

  • 서지정보서비스 : 장기간의 서지커뮤니케이션 업무실천을 통해 생산된 문헌지식과 효용정보의 집합체로서 압축, 2차, 지식의 특징을 가지고 있다.

  • 과학기술 신규성 검색 서비스: 신규성 검색의 주요 내용을 반영한 신규성 검색 포인트를 기반으로 컴퓨터 검색을 주요 수단으로 하고, 밀접하게 관련된 문헌 획득을 검색 대상으로 하여 종합적인 분석 및 비교 방법을 사용하여 평가합니다. 신규성 검색 항목의 신규성 문헌 평가를 위한 정보 컨설팅 서비스를 제공하고 근거, 분석, 비교 및 ​​결론이 포함된 신규성 보고서를 작성합니다.

    다양성:

    a) 다양한 서비스 콘텐츠

    b) 광범위한 서비스 대상

    c) 서비스 모델은 능동적인 경향이 있습니다.

    d) 서비스 플랫폼 기능에 대한 요구사항이 더 높습니다.

  • 과목정보서비스

    a) 주체정보 설정 서비스 모델

    b) 임베디드 교과정보 서비스 모델

    다) 협동교과정보서비스 모델

9.3.2 경쟁 정보 서비스

메인 콘텐츠:

  1. 환경 지능
  2. 상대 지능
  3. 그것
  4. 제품 정보

성능:

  1. 조기 경고 기능: 경쟁사를 이해하고 의사 결정의 불확실성과 시장 활동의 맹목성을 줄입니다.
  2. 의사결정 지원 제공: 기업이 투자, 인수합병, 운영, 개발 등에 있어 과학적이고 합리적인 결정을 내릴 수 있도록 지원합니다.

경쟁 정보 기관:

  • 전문 기관: 중국 과학 기술 정보 협회 경쟁 정보 부서, 후난성 경쟁 정보 센터, McKinsey & Company 등
  • 경쟁 정보 서비스 시스템: 주로 경쟁사 조사, 산업 분석 및 연구, 시장 역학 모니터링, 운영 데이터 모니터링 및 실시간 정보 전송과 같은 모듈을 포함합니다.

9.3.3 의사결정 인텔리전스 서비스

의사결정 인텔리전스: 의사결정 기반을 제공하고 의사결정자의 요구를 충족할 수 있는 인텔리전스입니다.

메인 콘텐츠:

  • 상황 분석 서비스: 수집된 정보에 대한 분석 및 연구를 수행하고, 해당 국가 및 지역의 주요 연구 대상에 대한 개발 이력, 현황 및 동향을 요약하고, 영향 요인, 개발 동기 등을 밝힙니다.
  • 동적 모니터링 서비스: 특정 국가, 기관 또는 주제 분야의 최신 동적 정보를 수집 및 설계하고 이를 정리하여 적시에 정기적으로 관련 정부 부서에 제공합니다.
  • 미래예측 서비스 : 기존 인텔리전스를 분석하여 국내 관련 분야의 향후 발전 동향을 예측합니다.

주요 정보 기관:

  1. 정부가 주도하는 정보기관
  2. 학술정보기관
  3. 정부와 학계의 성격을 겸비한 정보기관
  4. 시장지향적 전문 컨설팅 조직

현대 정보 서비스에 대한 특정 요구 사항:

  • 학문 중심의 정보 기관: 사용자 중심으로의 전환
  • 기업형 경쟁지능 서비스 : 사용자 서비스 개인화, 사용자 참여, 사용자 협업 중심
  • 정부를 위한 의사결정 정보 서비스: 서비스 주체인 정부의 요구 사항을 이해하고 , 동적 정보 추적, 여론에 대한 신속한 대응 메커니즘 구축이 더욱 필요합니다 .

9.3.4 현대 정보기관의 발전 동향

  1. 데이터 마이닝 기반 지능화 서비스 : 서비스 범위 확대, 서비스 효율성 및 정확성 향상, 지능화 시스템 구축, 특히 데이터 수집 및 분석 기술에 대한 강력한 지원 제공
  2. 클라우드 컴퓨팅 기반 인텔리전스 서비스 : 인텔리전스 서비스 모델이 더욱 다양해짐, SaaS에 대응하는 원스톱 개인화 푸시, 인텔리전스 참조 컨설팅, 전문 컨설턴트, PaaS에 대응하는 인텔리전스 소프트웨어 개발 및 테스트 플랫폼, 통합 인텔리전스 지식 기반, 인텔리전스 분석 및 통계, 정보 지능형 수집 및 모니터링. IaaS에 대응하는 데스크탑 클라우드 및 클라우드 스토리지.
  3. 빅데이터 기반 인텔리전스 서비스 : 인텔리전스 서비스에 더 많은 정보 소스를 제공하여 정보의 풍부함과 신뢰성을 크게 향상시킵니다.
  4. 정보 서비스를 위한 싱크 탱크 구축 : 기관 관리 강화 및 연구 결과의 질 향상, 인재 팀 구축, 특히 전문가 지혜에 중요성 부여, 정보 서비스 기관을 조정하여 정부 의사 결정 지원 강화, 기술 혁신 가속화 및 변혁 촉진 싱크탱크의.

10. 정보교육

정보교육은 전문교육과 대중교육으로 구분된다.

  • 전문 교육: 특정 규범과 커리큘럼에 따라 중등 직업 학교, 대학, 과학 연구 기관에서 전문 인재를 훈련합니다.
  • 대중교육 : 각종 도서관과 문학정보기관에서 실시하는 독자교육, 대학에서 실시하는 관련 강좌, 각종 기관에서 실시하는 정보활용교육 등

세계 최초의 도서관 학교: 1887년, 미국 컬럼비아대학교 도서관행정대학

국내 정보과학 발전 이슈:

현 단계에서 학문으로서의 정보과학은 그 위치가 모호하고 향후 발전이 불확실합니다. 실질적이고 명확한 '이론적 핵심'이 부족합니다. 많은 연구 방법이 다른 분야의 성숙한 방법을 기반으로 채택하고 있습니다. 동시에 , 정보과학 연구 또한 확고한 핵심 연구 목표와 안정적인 연구 방향이 부족하여 학문적 연구의 주요 목표를 바꾸는 경우가 많습니다. 핵심은 자신이 존재하는 내부 및 외부 환경을 인식하고, 다양한 인재에 대한 사회의 요구를 충족시키기 위해 자신의 전문적 위치를 명확히 하고 훈련 과정을 표준화하는 것입니다.

  • 도서관학과 정보과학을 기반으로
  • 정보과학의 독립적인 포지셔닝을 바탕으로
  • '빅 인텔리전스' 개념을 바탕으로
  • 정보관리를 기반으로

해외 정보과학 교육의 발전: 정보과학 교육은 전통적인 도서관학 교육과 분리되는 경향을 보이기 시작했다.

정보 활용 능력(Information Literacy): 정보 활용 능력이 있는 사람은 정보가 필요한 시기를 판단하고 필요한 정보를 효과적으로 획득, 평가 및 활용할 수 있습니다.

지능 활용 능력: 주로 지능 인식, 지능 능력 및 지능 윤리의 세 가지 측면을 포함합니다.

  • 지능 인식은 지능 활용 능력의 선구자이며 사람들이 지능을 획득하려는 내재적 동기입니다.
  • 지능역량은 지능소양의 핵심이며 지능활동에서 조직적, 통제적 역할을 담당한다.
  • 정보윤리: 법률과 규정, 특정 도덕적 규범 준수

지능 리터러시를 향상시키는 방법은 무엇입니까?

  • 학교 학생들은 이론과 방법에 대한 연구를 강화할 수 있습니다.
  • 실무자는 이론적인 지침에 따라 연습과 요약을 늘립니다.
  • 일반인들도 논리적 사고의 좋은 습관을 기르는 데 관심을 기울여야 한다
  • 정보활용교육은 교육과 학습의 상호작용과 실천에 더 많은 관심을 기울일 것입니다.

11. 산업 인텔리전스

주요 지식 포인트:

  1. 데이터 기반, 분석 방법 및 기술, 과학 기술 지능의 제품 및 서비스
  2. 기업 경쟁력 인텔리전스 개발 현황, 데이터 소스, 플랫폼 시스템
  3. 공안정보 핵심 포인트

11.1 산업 인텔리전스 개요

  • 우리나라의 정보에는 주로 과학기술 정보, 기업 경쟁 정보(상업 정보), 국방 및 군사 정보, 공공 안보 및 국경 방어 정보가 포함됩니다.

  • 과학기술정보는 민간과학기술정보국방과학기술정보로 구분된다.

  • 엔터프라이즈 경쟁 인텔리전스는 강력한 경쟁 속성을 가지고 있습니다.

  • 공공 보안 정보 기관은 강력한 대립적 특성을 가지고 있습니다.

  • 국방·군사정보는 대결정보와 경쟁정보라는 이중성을 갖고 있다.

  • 모든 정보는 공개 정보 소스 분석을 매우 중요하게 생각합니다.

  • 분석 방법 및 수단:

    가) 과학기술정보 : 주로 문헌정보에 의존하는 방식

    b) 기업 경쟁 인텔리전스: 벤치마킹, 대인 네트워킹, SWOT 분석 및 기타 방법

    다) 공공보안 인텔리전스: 프로파일링 방법을 활용하고 단서분석 방법을 중심으로

    d) 국방 및 군사 정보: 인간 정보에 더 의존

11.2 현대 과학 및 기술 정보

  • 우리나라 최초의 종합 과학 기술 정보 기관: 중국 과학 기술 정보 연구소 (구 중국 과학 기술 정보 연구소)
  • 혁신 중심, 인텔리전스 우선

11.2.1 과학기술 정보 데이터 기반

  • 과학기술 정보 빅데이터: 과학기술 활동 요소와 요소 간 상관 관계에 대한 다소스 이종 대규모 데이터입니다.

  • 과학기술 활동 요소: 과학기술 투자, 과학기술 과목, 과학기술 플랫폼 조건, 과학기술 과정, 과학기술 교류, 과학기술 산출물, 과학기술 기획 및 관리

  • 과학기술정보 빅데이터의 특징:

    a) 다중 소스 이질성은 과학 기술 정보 빅데이터의 두드러진 특징입니다.

    b) 과학 및 기술 정보는 매우 역동적이고 점진적이며 적시성에 대한 요구 사항이 높습니다 .

    c) 과학기술정보 빅데이터는 국제적 이며 국내외 교류, 추적, 비교는 과학기술정보 빅데이터의 두드러진 특징으로 되었다.

11.2.2 과학기술 지능의 사용자 요구와 임무

계층적 관점에서 분류된 인텔리전스 사용자:

  1. 높은 수준의 의사 결정 사용자
  2. 중간 관리 사용자
  3. 일반 비즈니스 사용자

국가별 인텔리전스 사용자:

  1. 하이엔드 사용자(최고의 의사결정 사용자): 혁신적인 기술 개발 방향, 요구 사항, 사회적 영향 등에 주목합니다.
  2. 중급 사용자 : 기술 우선분야, 기성기술, 설비배치 등 방향을 중점적으로 다룬다.
  3. 특정 과학 연구자: 과학 및 기술 문제와 특정 기술 경로에 중점을 둡니다.
  • 인텔리전스 요구 사항은 인텔리전스 사용자에 따라 다릅니다.

    a) 전통적인 정보 요구 사항은 정보 사용자가 제기하거나 정보 직원이 설문지나 인터뷰를 통해 얻는 경우가 많습니다.

    b) 빅 데이터 환경에서는 새로운 기술을 통해 일부 인텔리전스 요구 사항을 포착할 수 있으며 잠재적인 인텔리전스 사용자 요구 사항도 마이닝할 수 있습니다.

  • 지능 요구에 영향을 미치는 요소:

    a) 인텔리전스 사용자 정보: 정적 정보(직업 배경, 외국어 수준) 및 동적 정보(최근 활동, 업무 관계 네트워크)의 영향을 받습니다.

    b) 인텔리전스 수요 상황: 정책 환경, 최첨단 핫스팟, 사회적 초점 문제, 산업 상황, 경쟁 환경 등

임무 무결성 이론을 기반으로 한 정보 의사결정 모델:

  1. 인텔리전스 식별: 광범위한 정보 소스(광범위하고 진실)로부터 유용하고 진실된 정보를 식별합니다.
  2. 인텔리전스 추적: 적시에 다양한 채널에서 정보를 수집하고 최신 정보를 포괄적으로 추적 및 스캔합니다(빠르고 완전함).
  3. 지능 비교: 경쟁 관계 및 상황 분석에 중점
  4. 지능평가 : 평가의 주요 내용은 과학기술 현황, 과학기술의 강점, 과학기술 기관이나 인재의 역량과 잠재력에 대한 평가, 이행 효과에 대한 평가이다. 과학 및 기술 정책이나 조치.
  5. 지능 예측: 주로 시간 노드, 개발 동향, 주요 이벤트, 기회 예측 등이 ​​포함됩니다.

11.2.3 과학기술정보 제품 및 서비스

지능의 본질은 상황보고인데, 이는 기존의 지식과 새로운 정보를 통합하여 형성되는 새로운 인식과 판단이다.

  • 지능제품 형태: 보고서
  • 보고서는 다시 동적 표현 보고서, 분야 또는 주제 심층 분석 보고서, 의사 결정 참고 보고서의 세 가지 유형 으로 나뉩니다.

세 가지 유형의 보고서:

  • 뉴스레터 : 국내외 최신상황 반영(중요행사, 최근성과, 최신조치 등)

  • 분야 또는 주제 심층분석 보고서 : 문헌정보를 바탕으로 특정 분야 또는 주제에 대한 종합적인 분석 및 요약을 실시하여 영향요인을 선별하고 개발맥락을 명확히 하며 기술 로드맵을 도출하고 핵심기술을 파악하여 개발 환경 및 경쟁 분석 종합적인 상황 공개 및 평가

  • 의사결정 보고 : 특정 사건이나 문제에 대해 분석과 연구를 통해 전략, 정책적 시사점을 담은 보고서나 정보를 구성하고, 각 계획의 장단점을 제시합니다.

빅데이터 환경의 인텔리전스 서비스의 새로운 기능:

  1. 액티브 서비스 : 멀티 소스 데이터와 융합하여 인텔리전스 요구 사항을 적시에 포착하고 인텔리전스 사용자 요구 사항의 변화를 실시간으로 모니터링합니다.
  2. 임베디드 서비스 : 전 분야에 걸쳐 객관적인 지능 관점에서 기술혁신을 위한 정보지능 지원 제공
  3. 인텔리전스 리더십 : 동적 추적 및 상황 분석을 기반으로 클러스터 분석, 진화 분석 및 기타 방법을 최대한 활용하여 사물의 개발 패턴을 분석하고 주요 및 보조 동향을 파악하며 달성하기 위한 장기 전략 및 단기 목표를 명확히 합니다. 미래 예측.

11.2.4 과학기술정보의 방법과 기법

과학기술정보 빅데이터 자원은 현대 과학기술 지능작업의 기초이며, 정확한 지능서비스는 데이터와 서비스 간의 관계를 해결해야 하며 방법과 기술의 지원이 필요합니다.

  • 멀티소스 이기종 데이터 융합 기술
  • 지능형 사용자 초상화 및 수요 감지 기술
  • 속성 컴퓨팅과 시나리오 컴퓨팅을 기반으로 한 새로운 컴퓨팅 기술
  • 지식 추출 및 온톨로지 구축에 중점을 둔 지식 시스템 기술

11.3 비즈니스 인텔리전스와 경쟁 인텔리전스

  • 비즈니스 인텔리전스라고도 알려진 비즈니스 인텔리전스는 비즈니스 정보를 수집, 관리 및 분석하는 프로세스입니다. 목적은 기업 내 모든 수준의 의사 결정자가 지식이나 통찰력을 얻고 더 유익한 결정을 내릴 수 있도록 장려하는 것입니다. 기업에.

  • 경쟁 인텔리전스는 경쟁 환경, 경쟁사, 경쟁 전략에 대한 정보 및 연구로, 프로세스이자 제품입니다.

경쟁 인텔리전스의 세 가지 핵심 기능:

  1. 전략적 조기 경보
  2. 정책 지원
  3. 지속적인 추적 및 학습

경쟁 정보 관련 기관:

  1. 기업 내 정보 센터
  2. 과학기술정보연구소 관련 사업부서
  3. 경쟁력 있는 정보시스템 개발 또는 솔루션 전문
  4. 관련 교육훈련기관

11.3.1 비즈니스 인텔리전스의 내용과 프로세스

(1) 경쟁사 정의: 제품 수준, 카테고리 수준, 카테고리 수준 경쟁자

(2) 비즈니스 인텔리전스 콘텐츠:

  1. 종합 정보: 다양한 각도에서 종합적인 상대 정보 제공
  2. 제품 정보
  3. 채널 인텔리전스
  4. 선전정보
  5. 시장 정보
  6. 인사정보
  7. 금융정보
  8. 입소문 정보

(3) 비즈니스 인텔리전스 분석

(4) 마케팅 활동을 수행합니다.

비즈니스 인텔리전스를 위한 데이터 지원:

  1. 기업 자체 데이터
  2. 제3자 데이터
  3. 공개 소스 데이터
  4. 다양한 전문 데이터 사이트

실제 정보 작업에서는 일반적으로 보다 포괄적인 파악을 위해 여러 웹사이트의 데이터를 집계하는 것이 필요합니다.

CIS(Competitive Intelligence System)란 정보 수집, 전문 검색 등 핵심 기술을 기반으로 기업 자체, 경쟁사, 기업 외부 환경의 인텔리전스 정보를 수집, 저장, 처리, 분석하는 애플리케이션 관리 시스템이다. 및 텍스트 마이닝 기업에 확고한 전략적 의사 결정 지원을 제공하여 핵심 경쟁력을 향상시킵니다.

  • 진정으로 귀중한 정보를 얻으려면 인간의 전략과 다양한 대인관계를 통해 얻어야 합니다.

11.4 공공 보안 정보

공공안보정보 연구내용은 '정보주도 치안'을 주제로 정보수집-정보전송-정보분석 및 판단-정보의사결정까지 '데이터체인'을 구축함으로써 목표를 달성할 수 있다. 범죄 표적 빠른 반응과 정확한 공격.

  • 공공 보안 정보는 치안 유지의 핵심입니다

  • 현재 문제: 데이터 자원, 수단 구축, 비즈니스 기능이 완전히 통합되지 않음

공공 보안 정보 분석 방법:

  1. 충돌 비교 방법
  2. 주파수 분석 방법
  3. 데이터 마이닝 방법
  4. 단어 분할 기술 및 방법
  5. 다차원 분석 방법

공공보안 인텔리전스의 업무는 주로 방어와 탐지에 반영되며 단서분석에 중점을 두고 있으며 효과적인 단서에 대한 심층적인 분석이 공공보안 인텔리전스의 핵심이다.

11.5 산업 인텔리전스 프론티어 연구 동향

(1) 빅데이터 지능분석

과학기술정보 빅데이터는 크게 세 가지 범주로 구성됩니다.

  1. 과학기술정보 핵심자료 : 논문, 특허 등
  2. 과학기술정보 지원자료 : 과학기술 유의어 사전, 감성어휘 등
  3. 과학 및 기술 정보의 주변 데이터: 블로그, 마이크로블로그, WeChat 공개 계정 등

빅데이터 환경에서의 과학기술 정보 서비스는 빅데이터의 이론적인 방법에만 의존하는 것이 아니라, 빅데이터의 개념을 실제 적용을 통해 실천해야 합니다.

(2) 지능형 지능 분석

  • 진정한 지능형 지능은 컴퓨터와 인간 두뇌의 유기적인 결합이어야 하지만, 인간 두뇌와 컴퓨터는 지능 작업에서 노동 분업과 비율이 다릅니다.
  • 인공지능의 획기적인 발전의 열쇠는 지식공학과 검색 알고리즘에 있습니다.

12. 현대정보과학의 발전

12.1 지식 관리와 경쟁 정보

지식 관리: 지식 공유를 통해 집단적 지혜를 활용하여 적응성과 혁신 역량을 향상하고 조직이 명시적 및 암묵적 지식을 공유할 수 있는 새로운 방법을 제공합니다. ( 공유 )

  • 내부지식의 발견과 창출에 집중
  • 기업이 지식 교환을 구축하는 플랫폼이자 방법입니다.

경쟁 정보:

  • Bao Changhuo(1998)는 다음과 같이 정의했습니다. 경쟁 인텔리전스는 경쟁 환경, 경쟁자 및 경쟁 전략에 대한 정보 및 연구를 의미하며 프로세스이자 제품입니다.
  • 미국 경쟁 정보 실무자 협회(American Association of Competitive Intelligence Practitioners): 법적 수단을 통해 상업적 경쟁에서 비즈니스 행동의 장점, 단점 및 목적에 대한 정보를 수집하고 분석하는 전반적인 경쟁 환경에 대한 포괄적인 모니터링 프로세스입니다.
  • 외부 환경에 집중하고 경쟁 정보를 지능과 전략으로 전환합니다.
  • 기업의 의사결정을 위한 인텔리전스 및 기술 제공

둘 사이의 차이점은 다음과 같습니다.

  1. 수집
    지식 관리는 조직 내에서 지식을 채굴하는 데 중점을 두는 반면, 경쟁 인텔리전스는 조직 내부와 외부에서 정보를 종합적으로 채굴하는 것입니다.

  2. 정리하다

    ​ 지식 관리는 목록화 및 보관, 검색 및 협업 기능 향상, 지식 공유 및 재사용 촉진에 중점을 둡니다.

    ​ Competitive Intelligence는 지식경영을 기반으로 분석과 연구를 진행하여 의사결정을 위한 제안을 제공합니다.

  3. 사용

    지식 관리는 전파에 초점을 맞추는 반면, 경쟁 정보는 행동에 초점을 맞춥니다.

둘 사이의 관계: 지식은 행동을 통해 지능이 되고, 행동은 전략적 의사결정과 전략 및 전술적 행동의 실행에 영향을 미치며, 경쟁지능은 실행과 행동을 통해 지식 활용 수준을 향상시킵니다. 따라서 둘은 서로 보완적이고 보완적입니다.

12.1.1 경쟁지능과 지식관리의 통합 전략

통합된 경로와 방법이 문제의 핵심입니다

전략적 보호 계수

전략적 보호 요소(SPF, 2005): 환경에 대한 회사의 민감도, 회사의 전반적인 지식 상태 및 위험 상태의 현실, 지식 자산 관리 전략을 개발할 때 직면하는 과제를 설명하고 분석하는 데 사용됩니다.

지식 관리 위험 및 경쟁 정보 위험 포트폴리오:

  • 낮은 지식 관리 위험 - 경쟁력이 낮은 정보 위험 관리자
    의 고유한 재능, 행운 및 기회

  • 높은 지식 관리 위험 - 낮은 경쟁 정보 위험

    ​독점 기업

  • 낮은 지식 관리 위험 - 높은 경쟁 인텔리전스 위험
    지식 자산을 쉽게 발견할 수 있는 성숙한 산업 분야의 기업

  • 높은 지식 관리 위험 - 높은 경쟁 정보 위험
    첨단 기술 산업 및 제약 산업

SPF 정책 프레임워크

표 12-1 전략적 보호계수
위험 수준 낮은 지식 관리 위험 높은 지식 관리 위험
낮은 경쟁 인텔리전스 위험
저CI/저KI

SPF5: 우수
저CI/고KI

SPF15: 거인들과의 협업과 공생
높은 경쟁 인텔리전스 위험
고CI/저KI

SPF30: 내화 인클로저 또는 유리 하우스 구축
저CI/고KI

SPF45: 전면 봉쇄, 냉전

SPF 분석 프레임워크

  • 국가 차원
  • 산업 수준
  • 조직(기업) 수준
섀도우 팀

섀도우 팀(Shadow Team): 다양한 배경과 지식 구조를 가진 다양한 부서와 직위의 사람들로 구성된 정보 팀

  • 성공적인 경쟁 인텔리전스의 핵심은 모든 측면의 정보와 데이터를 통합하는 것입니다.
  • 경쟁지능의 목적은 전략적 사고 수준을 향상시키기 위해 적절한 지능을 제공하는 것입니다.

섀도우 팀의 기능과 의미:

  1. 경쟁적 지식으로부터 지적 자본 창출
    지식 자산의 가치를 창출하려면 경쟁적 지식 실천을 통해 완성되어야 합니다.
  2. 지식을 지능으로 전환하고,
    직원의 적극적인 참여를 독려하며, 암묵지를 형식지로 전환하는 능력
  3. 이는 경쟁 인텔리전스와 지식 관리 시스템을 연결하는 역할을 하며,
    섀도우 팀은 지식 관리와 경쟁 인텔리전스라는 공통 목표를 달성하고 기업의 경쟁력을 향상시킵니다.

12.2 과학계량학과 학문적 평가

"세 가지 전략":

  • 계량서지학
  • 과학계량학
  • 인포메트릭스

관련 정의:

  • 과학계량학(Scientometrics)은 과학 문서의 생산, 보급, 활용에서 얻은 데이터를 사용하여 과학 및 과학 연구 활동의 특성을 정량적으로 설명하려는 학문입니다(Braunwen 1989).
  • 과학계량학(Scientometrics)은 정량적 방법을 사용하여 과학 활동의 입력, 출력 및 프로세스를 처리하고 계산하는 연구 분야입니다(Liang Liming, Wuyishan).

12.2.1 알트메트릭스

  • 학술 연구의 사회적 영향을 평가하기 위해
  • 소셜 미디어를 데이터 소스로 간주하여 웹 기반 학술 자료를 설명하는 데 사용됩니다.
  • 보충계측은 주로 통계과학 연구 결과를 인터넷에서 열람, 다운로드, 클릭, 저장 등을 하는 상황에서 사용됩니다.

좁은 의미의 상보성: 소셜 네트워크에서의 학문적 상호작용 측정

광범위한 보완성: 인용 데이터 이외의 모든 정보 소스(예: 사용, 획득, 언급, 소셜 미디어 등)를 포괄합니다.

보완적 계측의 특징 및 장점:

  1. 다양한 정보 소스
  2. 실시간으로 사용자를 확보하고 추적할 수 있는 강력한 적시성 및
    인터넷의 편리성
  3. 포괄적인 정량적 영향:
    학술 결과는 전문 학술 연구자와 비전문 학술 연구자 모두에게 영향을 미칩니다.
  4. 더 큰 응용 가치
    연구자의 사회적 영향력을 입증하고 잠재적인 협력 기회를 발견하며 과학 연구의 개방성과 공정성을 촉진할 수 있습니다.

보충 계측의 중요성:

  1. 독자를 위한 고품질 기사 화면
  2. 작가에 대한 작품의 영향력 수준을 보여줍니다.
  3. 자원관리자를 위한 맞춤형 서비스에 대한 참고자료 제공
  4. 과학연구관리 인력의 평가업무 수행 편의성 제공

12.3 정보시각화와 과학지식 그래프

정보 시각화의 목적은 대규모 데이터와 효율적으로 상호 작용하고 정보의 내부 특성과 패턴을 발견하는 것입니다.

국제 연구 진행 및 동향:

  • 전반적인 성장 추세
  • 3D, 다이내믹, VR 등 다양한 모드에서 새로운 돌파구를 마련할 것으로 기대된다.

국내 연구 진행 및 동향:

  • 전반적인 상승 추세

12.3.1 이미지 및 상황필드의 시각적 분석

마이크로 레벨 - 콘텐츠(키워드, 제목 등) 기반

  • 단어빈도분석법은
    특정 연구 분야의 문헌에서 그 문헌의 신빙성 있는 내용을 설명하거나 표현할 수 있는 키워드나 주제어의 빈도를 이용하여 해당 분야의 연구 핫스팟과 발전 방향을 파악하는 방법이다.
  • 공동 단어 분석 방법은
    문서에서 단어 그룹이 나타나는 횟수를 계산하고, 이를 기반으로 군집 분석을 수행하여 이러한 단어 간의 긴밀한 관계와 이들이 나타내는 학문 분야 및 주제의 구조를 반영하도록 변경됩니다.

메조 레벨 - 활용 프로세스(문서 간 관계) 기준

  • 인용분석 방법은
    수학적, 통계적 방법을 이용하여 과학문헌의 인용 현상과 패턴을 분석하여 그 정량적 특성과 고유한 패턴을 밝혀냅니다.
  • 동시 인용 분석 방법
    두 개의 문서가 다른 문서에서 동시에 인용되고, 동시 인용 강도를 이용하여 동시 인용 관계가 있는 문서 간의 관련성과 유사성을 반영합니다.
  • 인용결합도 분석법은
    하나 이상의 논문을 공동으로 인용한 두 문헌 간의 동시인용관계를 말하며, 동시인용 횟수를 인용결합강도라고 하며, 결합강도는 학문분야 간의 고유한 상관관계를 반영한다.

거시적 수준 - 지식 네트워크 기반

  • 소셜 네트워크는 사회적 행위자들의 집합과 그들 사이의 관계를 의미합니다.
  • 복합 네트워크는 일반 네트워크와 랜덤 네트워크 사이에서 실제 네트워크에 가까운 네트워크 모델로, 멱법칙 분포, 작은 세계, 규모 없는 특성을 갖습니다.
과학 지식 지도
  • 과학지식 그래프는 과학지식의 발전과정과 현황, 구조적 관계를 표시한 그래프이다.

  • 일반적으로 사용되는 소프트웨어:
    1) 일반 소프트웨어 - SPSS
    2) 특수 소프트웨어 - Bibexcel, Histcite 등
    3) 지식 그래프 작성 및 분석 도구 - CiteSpace, VOSviewer 등
    4) 텍스트 마이닝 소프트웨어 - TDA, Loet Leydesdorff 등

과학지식 그래프 연구의 유래:

  1. 컴퓨터공학 분야의 데이터, 정보, 지식 및 지식 영역 시각화 연구
  2. 문헌정보학 분야의 인용분석 시각화, 지식네트워크, 지식맵 연구
  3. 복잡한 네트워크 연구, 소셜 네트워크 분석 등

12.4 정보경제학과 정책 분석

중국에서 정보경제학은 경제학과 정보과학 모두와 결합되는 특별한 학문적 성격을 갖고 있습니다.

  • 거시정보 경제학

  • 미시정보경제학
    1) 비대칭정보경제학 연구
    2) 정보경제 및 정보산업경제 연구
    3) 전자상거래경제 연구
    4) 네트워크경제 연구
    5) 지식경제 연구

정책분석

  • 해외 정의: 정책 분석은 사회 문제 해결에 현대 과학 기술을 적용하고, 실질적인 행동 과정을 모색하고, 정보를 생성하고, 유리한 증거를 나열하고, 행동 과정의 가능한 결과를 예측하여 의사 결정자가 최적의 행동 계획을 선택하도록 돕습니다. 쿼드와 카터, 1989)
  • 국내적 정의 : 정책분석의 과정과 목적에서 정의하고, 정부 관련 활동의 원인과 결과를 기술하고 설명하며, 공공정책의 인과성을 검증하고, 정책결정 과정에서 필요한 관련 지식을 정책입안자에게 제공한다.

12.5 네트워크 정보 관리 및 비즈니스 데이터 분석

우리나라의 정보관리 역사:

  1. 고대의 정보관리는
    정보량이 적고 단조로웠으며, 주로 수작업 처리에 의존하였고, 전송 및 활용보다는 저장이 주를 이루었습니다.
  2. 현대 정보관리
    라이브러리의 출현으로 정보관리의 목적은 단순한 저장에서 저장과 이용의 결합으로 발전하였다.
  3. 현대 정보 관리는
    정보 자원을 다양화하고 커뮤니케이션 채널을 지속적으로 혁신합니다.

네트워크 정보 관리를 위한 빅데이터의 기회:

  • 네트워크 정보 관리 효율성 향상
  • 네트워크 정보관리의 과학적인 성격을 반영
  • 네트워크 정보 관리의 인간화 강조

네트워크 정보 관리에 대한 빅데이터의 과제:

  • 데이터 수집 및 집계가 더욱 복잡해졌습니다.
  • 데이터 분석에 대한 더 높은 요구 사항
  • 데이터 정보 분석 및 관리가 더욱 다양해졌습니다.

빅데이터 맥락에서 정보 관리자를 위한 대응 조치:

  1. 시대의식을 유지하기 위해서는 데이터의 지속적인 증가와 규칙의 지속적인 강화를 중심으로 네트워크 정보관리가 개선되어야 하며, 빅데이터 기술의 지속적인 적용과 심화로 정보관리에 대한 사고가 조정되어야 합니다.
  2. 네트워크 정보관리의 발전은 빅데이터 기술의 효과적인 활용과 불가분의 관계에 있습니다.
  3. 정보관리 보안에 유의하고, 데이터 규칙을 준수하는 네트워크 정보관리 보안체계를 구축합니다.

수준
3. 자원 관리자를 위한 맞춤형 서비스에 대한 참고 제공
4. 과학연구 관리 인력이 평가 업무를 수행할 수 있는 편의 제공

12.3 정보시각화와 과학지식 그래프

정보 시각화의 목적은 대규모 데이터와 효율적으로 상호 작용하고 정보의 내부 특성과 패턴을 발견하는 것입니다.

국제 연구 진행 및 동향:

  • 전반적인 성장 추세
  • 3D, 다이내믹, VR 등 다양한 모드에서 새로운 돌파구를 마련할 것으로 기대된다.

국내 연구 진행 및 동향:

  • 전반적인 상승 추세

12.3.1 이미지 및 상황필드의 시각적 분석

마이크로 레벨 - 콘텐츠(키워드, 제목 등) 기반

  • 단어빈도분석법은
    특정 연구 분야의 문헌에서 그 문헌의 신빙성 있는 내용을 설명하거나 표현할 수 있는 키워드나 주제어의 빈도를 이용하여 해당 분야의 연구 핫스팟과 발전 방향을 파악하는 방법이다.
  • 공동 단어 분석 방법은
    문서에서 단어 그룹이 나타나는 횟수를 계산하고, 이를 기반으로 군집 분석을 수행하여 이러한 단어 간의 긴밀한 관계와 이들이 나타내는 학문 분야 및 주제의 구조를 반영하도록 변경됩니다.

메조 레벨 - 활용 프로세스(문서 간 관계) 기준

  • 인용분석 방법은
    수학적, 통계적 방법을 이용하여 과학문헌의 인용 현상과 패턴을 분석하여 그 정량적 특성과 고유한 패턴을 밝혀냅니다.
  • 동시 인용 분석 방법
    두 개의 문서가 다른 문서에서 동시에 인용되고, 동시 인용 강도를 이용하여 동시 인용 관계가 있는 문서 간의 관련성과 유사성을 반영합니다.
  • 인용결합도 분석법은
    하나 이상의 논문을 공동으로 인용한 두 문헌 간의 동시인용관계를 말하며, 동시인용 횟수를 인용결합강도라고 하며, 결합강도는 학문분야 간의 고유한 상관관계를 반영한다.

거시적 수준 - 지식 네트워크 기반

  • 소셜 네트워크는 사회적 행위자들의 집합과 그들 사이의 관계를 의미합니다.
  • 복합 네트워크는 일반 네트워크와 랜덤 네트워크 사이에서 실제 네트워크에 가까운 네트워크 모델로, 멱법칙 분포, 작은 세계, 규모 없는 특성을 갖습니다.
과학 지식 지도
  • 과학지식 그래프는 과학지식의 발전과정과 현황, 구조적 관계를 표시한 그래프이다.

  • 일반적으로 사용되는 소프트웨어:
    1) 일반 소프트웨어 - SPSS
    2) 특수 소프트웨어 - Bibexcel, Histcite 등
    3) 지식 그래프 작성 및 분석 도구 - CiteSpace, VOSviewer 등
    4) 텍스트 마이닝 소프트웨어 - TDA, Loet Leydesdorff 등

과학지식 그래프 연구의 유래:

  1. 컴퓨터공학 분야의 데이터, 정보, 지식 및 지식 영역 시각화 연구
  2. 문헌정보학 분야의 인용분석 시각화, 지식네트워크, 지식맵 연구
  3. 복잡한 네트워크 연구, 소셜 네트워크 분석 등

12.4 정보경제학과 정책 분석

중국에서 정보경제학은 경제학과 정보과학 모두와 결합되는 특별한 학문적 성격을 갖고 있습니다.

  • 거시정보 경제학

  • 미시정보경제학
    1) 비대칭정보경제학 연구
    2) 정보경제 및 정보산업경제 연구
    3) 전자상거래경제 연구
    4) 네트워크경제 연구
    5) 지식경제 연구

정책분석

  • 해외 정의: 정책 분석은 사회 문제 해결에 현대 과학 기술을 적용하고, 실질적인 행동 과정을 모색하고, 정보를 생성하고, 유리한 증거를 나열하고, 행동 과정의 가능한 결과를 예측하여 의사 결정자가 최적의 행동 계획을 선택하도록 돕습니다. 쿼드와 카터, 1989)
  • 국내적 정의 : 정책분석의 과정과 목적에서 정의하고, 정부 관련 활동의 원인과 결과를 기술하고 설명하며, 공공정책의 인과성을 검증하고, 정책결정 과정에서 필요한 관련 지식을 정책입안자에게 제공한다.

12.5 네트워크 정보 관리 및 비즈니스 데이터 분석

우리나라의 정보관리 역사:

  1. 고대의 정보관리는
    정보량이 적고 단조로웠으며, 주로 수작업 처리에 의존하였고, 전송 및 활용보다는 저장이 주를 이루었습니다.
  2. 현대 정보관리
    라이브러리의 출현으로 정보관리의 목적은 단순한 저장에서 저장과 이용의 결합으로 발전하였다.
  3. 현대 정보 관리는
    정보 자원을 다양화하고 커뮤니케이션 채널을 지속적으로 혁신합니다.

네트워크 정보 관리를 위한 빅데이터의 기회:

  • 네트워크 정보 관리 효율성 향상
  • 네트워크 정보관리의 과학적인 성격을 반영
  • 네트워크 정보 관리의 인간화 강조

네트워크 정보 관리에 대한 빅데이터의 과제:

  • 데이터 수집 및 집계가 더욱 복잡해졌습니다.
  • 데이터 분석에 대한 더 높은 요구 사항
  • 데이터 정보 분석 및 관리가 더욱 다양해졌습니다.

빅데이터 맥락에서 정보 관리자를 위한 대응 조치:

  1. 시대의식을 유지하기 위해서는 데이터의 지속적인 증가와 규칙의 지속적인 강화를 중심으로 네트워크 정보관리가 개선되어야 하며, 빅데이터 기술의 지속적인 적용과 심화로 정보관리에 대한 사고가 조정되어야 합니다.
  2. 네트워크 정보관리의 발전은 빅데이터 기술의 효과적인 활용과 불가분의 관계에 있습니다.
  3. 정보관리 보안에 유의하고, 데이터 규칙을 준수하는 네트워크 정보관리 보안체계를 구축합니다.

추천

출처blog.csdn.net/YuvalNoah/article/details/130567401