Named Graph란 무엇이고, 표현 방식과 장점이 무엇일까요?

웹 환경에서 이 이름은 URI 형식이며, RDF 표준은 명명된 그래프(named graph)라는 방법을 제공한다. 명명된 그래프는 그 자체가 URI이며, 고유의 이름이 있는 트리플 집합을 의미한다. (81쪽)

여기에서 named grph란 무엇이고 어떻게 표현되는지 궁금합니다. 더불어 명명된 그래프를 사용했을 때 장점이 무엇인지도 궁금합니다.

처음에는 그래프에 이름을 지정한다는 것을 여러 개의 트리플이 모여있는 그래프 전체에 하나의 URI를 부여하는 것으로 생각했는데요, 설명을 읽다보니 각각의 트리플에 URI를 부여하는 것이라는 생각이 듭니다. 그렇다면 이렇게 각각의 트리플에 이름을 지정한다는 것이 무엇인지, 어떻게 표현이 되고 장점이 있는 것일까요?

RDF 트리플로 구성된 데이터베이스의 장점은 URI를 기반으로 통합이 용이하고 RDB와 다르게 중복된 스키마 구조나 값이 없다는 것입니다.

다만, 모든 트리플이 하나의 데이터베이스에 존재한다고 가정하면 그 중 특정 context에 해당하는 트리플들만 탐색하고 싶을 때는 오히려 모든 게 연결되어 있으니 구분이 어렵습니다.
이런 상황에서 트리플에 context가 부여되어있다면 데이터베이스 내 트리플의 연결관계와 상관없이 원하는 정보만 추출할 수 있다는 것이 장점이라고 생각합니다.

인용문구의 질문은 제가 이해하기로는 이 두문장 모두 named graph에 해당한다고 생각합니다. 여러개의 트리플을 특정 context로 해석할 수 있고, 하나의 트리플만이 해당하게도 가능하니 트리플의 수량과 named graph는 이론상 크게 관련없다고 이해했습니다.

named graph를 표현하는 방식에는 이 곳을 참고하시면 좋을 것 같습니다.

아하 그럼 모델링의 목적에 따라 named graph의 범위를 설정하면 되겠군요.
그런데 그래프에 이름을 붙이면 통합 과정에서 더 간단하게 데이터를 연결할 수 있다는 점은 이해를 했는데, 만약 통합 과정에서 여러 개의 트리플을 포함하고 있는 named graph를 수정 혹은 해체해야 한다면 과정이 더 복잡해지는 문제가 발생할 수도 있지 않을까요?

웹에 게시된 자원에 대한 설명을 하고 있는 트리플들의 집합, 즉 RDF 문서를 효과적으로 구분할 수 있는 방안으로 URI가 부여된 Named Graph라는 방안을 사용하는겁니다. 그리고 이러한 트리플들의 집합이 트리플 스토어에 저장할 때 위에 분이 말씀하신 것과 같이 컨텍스트를 구분하여 저장해야 할 필요성에 따라 그래프명을 부여하여 데이터셋을 관리하고 있고요. 추가적으로 질문하신 내용은 named graph를 수정/삭제해야하는 경우 그렇게 큰 복잡성이 발생하지는 않습니다. 그래프 구조의 유연함으로 인해 다른 저장방식보다 수월하게 가능합니다.

1개의 좋아요