常见问题¶

我们收集了用户使用 GraphScope 过程中的常见问题，如果在下面的列表中仍然无法找到您遇到的问题的答案，可通过提交 Issues 或者在 Discussions 与我们联系。

运行 GraphScope 系统需要的最小资源是多少？
在通过 Python 客户端使用 GraphScope 过程中，需要的最低 Python 版本是3.6+，最低pip版本是 19.0+，GraphScope 系统支持以单机或分布式的方式部署，单机情况下，资源需求 CPU >= 4 核，内存 >= 8 G； GraphScope 在支持以下环境中运行
- CentOS 7+
- Ubuntu 18.04+
- macOS 12 (Intel/Apple Silicon)
对于分布式部署，需要用户拥有一个 Kubernetes 集群，GraphScope 在 Kubernetes version >= v1.12.0+ 的环境上测试通过。
GraphScope 是否强依赖 Kubernetes?

GraphScope 支持在单机模式安装运行。 GraphScope 的预编译包以 Python wheel 的形式分发，可以用 pip 快速安装：pip3 install graphscope。
如何如查看 GraphScope 的运行时信息？
默认情况下，GraphScope 运行不打印日志信息，你可以通过 show_log 参数开启日志输出。
graphscope.set_option(show_log=True)
如果您的GraphScope运行在k8s集群上，可以使用 kubectl describe/logs 来查看系统的当前状态，同时如果你可以访问 Pod 的磁盘，也可在 /tmp/gs/runtime/logs 目录下查看运行时日志。
为什么在使用 kubectl get pod 命令时，发现了一些多余的 Pod?

对于其中一些失败的 Pod，只能通过手动执行命令如 kubectl delete pod <pod_name> 进行删除。通常情况下，该问题出现在使用 Helm 部署 GraphScope 时，GraphScope 依赖一些权限来删除运行时的资源，如果用户没有正确设置 role 和 rolebinding 等权限，helm uninstall <release-name> 可能不能正确回收分配的资源。详细细节可以查看 Helm Support
GraphScope 是图数据库吗？

GraphScope 并不是一个图数据库，但其包含一个持久图存储的组件 graphscope-store 可以被用作数据库。
GraphScope 在 Gremlin 上的兼容性如何？

目前，GraphScope支持Gremlin语言中的大部分查询算子，可通过该文档查看详细的支持信息。
GraphScope 看起来在运行过程中卡住了？
如果 GraphScope 看起来像卡住，可能的原因有：
- 在会话的拉起阶段，如果当前网络下载镜像过慢，或当前集群资源无法满足请求的资源时，会造成卡住的现象。
- 载图阶段，可能会由于数据量过大造成短暂的卡住现象。
- 在执行图算法分析阶段，或者使用用户自定义的算法，编译构建应用的库时会花费一些时间。
为什么载图时报找不到文件的错误？

这通常发生在以集群方式部署运行 GraphScope 时，数据文件必须要对 engine Pod 可见。你也许需要挂载磁盘或者使用云存储提供商的服务。

如果你的集群是使用 kind 部署的, 你应该需要设置 extra-mounts 来把本机目录挂载到 Kind 虚拟的 Node 中。
k8s_vineyard_mem, vineyard_shared_mem 和 k8s_engine_mem 有什么区别，如何设置？
- k8s_vineyard_mem: 为 vineyard 容器分配的内存。它存储由 vineyard 管理的原始数据的的元信息，例如形状、ID、名称等。由于元数据比数据集小得多，因此在大多数情况下默认配置就足够了。它相当于 graphscope 的 helm chart 中的 vineyard.resources.memory.requests 和 vineyard.resources.memory.limits 。
- vineyard_shared_mem: 存储数据集的内存。我们发现将其设置为数据集在磁盘上的大小的 5 倍通常是一个合理的值。它相当于 graphscope 的 helm chart 中的 vineyard.shared_mem。
- k8s_engine_mem: engine 容器的内存大小。一般将其设置为 vineyard_shared_mem 的同样大小。它相当于 graphscope 的 helm chart 中的 engines.resources.memory.requests 和 engines.resources.memory.requests。
导致在 Apple M1 python3.8 环境下安装 GraphScope 失败的原因可能有哪些？
- 编译 grpcio 失败: 你可以通过 export GRPC_PYTHON_BUILD_SYSTEM_OPENSSL=True 来尝试使用系统安装的 openssl 编译 grpcio。详情可参考 grpc issue
- 编译 scipy 失败: 你可以根据此教程来源码编译，或尝试通过 pip3 install --pre -i https://pypi.anaconda.org/scipy-wheels-nightly/simple scipy 来解决这个问题。
在 NFS 上分配 PV 时遇到了 Permission denied 问题，如何解决？
- Appearance: 通常当使用 helm 的方式安装 graphscope-store 时，Pod graphscope-store-kafka-0 , graphscope-store-zookeeper-0 会报 CrashLoopBackOff 错误
- Check: 我们通过 kubectl logs graphscope-store-zookeeper-0 来查看日志，此时日志显示 mkdir: cannot create directory '/bitnami/zookeeper/data': Permission denied
- Solution: 通常有两种解决方式:
  1. 快速的方式是在所有相关的 PV 目录上使用 chmod 777 ，但不建议在生产环境中使用。
  2. 优雅的方法是首先创建 graphscope 用户和用户组，然后将 graphscope 上的访问权限授予相关NFS目录。
为什么在 Kubernetes 集群上拉起 GraphScope 实例时，产生超时异常？

大多数情况下，超时的原因是因为在 Kubernetes 集群拉起 GraphScope 实例时需要下载对应镜像，这一步通常需要几分钟的时间，你可以通过 graphscope.set_option(timeout_seconds=600) 适当的增加超时等待时间来解决该问题。
启动GraphScope时由于连接v6d，etcd等组件失败而导致GraphScope启动失败?

这可能是由于你所使用的机器（或容器）所在的企业网络内要求相应的代理设置方可正常使用网络。这些代理设置可能会导致错误的地址解析以及端口占用。为避免类似情况，可在环境变量 no_proxy 或 NO_PROXY 中加入GraphScope相关的地址，如 hostname -i 以及 0.0.0.0 （请注意`no_proxy的前后缀规则 <https://unix.stackexchange.com/questions/23452/set-a-network-range-in-the-no-proxy-environment-variable>`_）

其他问题

您可以提交 Issues 或者在 Discussions 提出你的问题，同时，您也可以使用 Slack 或 DingTalk 与我们联系。