Whamcloud - gitweb
LU-15095 target: lbug_on_grant_miscount module parameter
[fs/lustre-release.git] / lustre / include / lu_target.h
index 295902b..2a361ac 100644 (file)
  * Copyright (c) 2009, 2010, Oracle and/or its affiliates. All rights reserved.
  * Use is subject to license terms.
  *
- * Copyright (c) 2011, 2016, Intel Corporation.
+ * Copyright (c) 2011, 2017, Intel Corporation.
  */
 /*
  * This file is part of Lustre, http://www.lustre.org/
- * Lustre is a trademark of Sun Microsystems, Inc.
  */
 
 #ifndef _LUSTRE_LU_TARGET_H
@@ -38,6 +37,7 @@
 #include <lustre_update.h>
 #include <lustre_disk.h>
 #include <lustre_lfsck.h>
+#include <lu_object.h>
 
 /* Each one represents a distribute transaction replay
  * operation, and updates on each MDTs are linked to
@@ -97,8 +97,9 @@ struct target_distribute_txn_data {
        struct list_head        tdtd_list;
 
        /* Threads to manage distribute transaction */
-       wait_queue_head_t       tdtd_commit_thread_waitq;
+       struct task_struct      *tdtd_commit_task;
        atomic_t                tdtd_refcount;
+       struct lu_env           tdtd_env;
 
        /* recovery update */
        distribute_txn_replay_handler_t tdtd_replay_handler;
@@ -116,12 +117,47 @@ struct target_distribute_txn_data {
        void                    *tdtd_show_retrievers_cbdata;
 };
 
+struct tg_grants_data {
+       /* grants: all values in bytes */
+       /* grant lock to protect all grant counters */
+       spinlock_t               tgd_grant_lock;
+       /* total amount of dirty data reported by clients in incoming obdo */
+       u64                      tgd_tot_dirty;
+       /* sum of filesystem space granted to clients for async writes */
+       u64                      tgd_tot_granted;
+       /* grant used by I/Os in progress (between prepare and commit) */
+       u64                      tgd_tot_pending;
+       /* amount of available space in percentage that is never used for
+        * grants, used on MDT to always keep space for metadata. */
+       u64                      tgd_reserved_pcnt;
+       /* number of clients using grants */
+       int                      tgd_tot_granted_clients;
+       /* shall we grant space to clients not
+        * supporting OBD_CONNECT_GRANT_PARAM? */
+       int                      tgd_grant_compat_disable;
+       /* protect all statfs-related counters */
+       spinlock_t               tgd_osfs_lock;
+       time64_t                 tgd_osfs_age;
+       int                      tgd_blockbits;
+       /* counters used during statfs update, protected by ofd_osfs_lock.
+        * record when some statfs refresh are in progress */
+       int                      tgd_statfs_inflight;
+       /* writes between prep & commit which might be accounted twice in
+        * ofd_osfs.os_bavail */
+       u64                      tgd_osfs_unstable;
+       /* track writes completed while statfs refresh is underway.
+        * tracking is only effective when ofd_statfs_inflight > 1 */
+       u64                      tgd_osfs_inflight;
+       /* statfs optimization: we cache a bit  */
+       struct obd_statfs        tgd_osfs;
+};
+
 struct lu_target {
        struct obd_device       *lut_obd;
        struct dt_device        *lut_bottom;
+       struct dt_device_param   lut_dt_conf;
 
        struct target_distribute_txn_data *lut_tdtd;
-       struct ptlrpc_thread    lut_tdtd_commit_thread;
 
        /* supported opcodes and handlers for this target */
        struct tgt_opc_slice    *lut_slice;
@@ -135,7 +171,12 @@ struct lu_target {
        unsigned int             lut_syncjournal:1,
                                 lut_sync_lock_cancel:2,
                                 /* e.g. OST node */
-                                lut_no_reconstruct:1;
+                                lut_no_reconstruct:1,
+                                /* enforce recovery for local clients */
+                                lut_local_recovery:1,
+                                lut_cksum_t10pi_enforce:1;
+       /* checksum types supported on this node */
+       enum cksum_types         lut_cksum_types_supported;
        /** last_rcvd file */
        struct dt_object        *lut_last_rcvd;
        /* transaction callbacks */
@@ -165,12 +206,27 @@ struct lu_target {
        /** cross MDT locks which should trigger Sync-on-Lock-Cancel */
        spinlock_t               lut_slc_locks_guard;
        struct list_head         lut_slc_locks;
+
+       /* target grants fields */
+       struct tg_grants_data    lut_tgd;
+
+       /* target tunables */
+       const struct attribute  **lut_attrs;
+
+       /* FMD (file modification data) values */
+       int                      lut_fmd_max_num;
+       time64_t                 lut_fmd_max_age;
 };
 
+#define LUT_FMD_MAX_NUM_DEFAULT 128
+#define LUT_FMD_MAX_AGE_DEFAULT (obd_timeout + 10)
+
 /* number of slots in reply bitmap */
 #define LUT_REPLY_SLOTS_PER_CHUNK (1<<20)
 #define LUT_REPLY_SLOTS_MAX_CHUNKS 16
 
+#define TRD_INDEX_MEMORY -1
+
 /**
  * Target reply data
  */
@@ -185,6 +241,8 @@ struct tg_reply_data {
        int                     trd_index;
        /** tag the client used */
        __u16                   trd_tag;
+       /** child fid to reconstruct open */
+       struct lu_fid           trd_object;
 };
 
 extern struct lu_context_key tgt_session_key;
@@ -216,6 +274,8 @@ struct tgt_session_info {
 
        /* object affected by VBR, for last_rcvd_update */
        struct dt_object        *tsi_vbr_obj;
+       /* open child object, for last_rcvd_update */
+       struct dt_object        *tsi_open_obj;
        /* opdata for mdt_reint_open(), has the same value as
         * ldlm_reply:lock_policy_res1.  The tgt_update_last_rcvd() stores
         * this value onto disk for recovery when tgt_txn_stop_cb() is called.
@@ -257,6 +317,17 @@ static inline void tgt_vbr_obj_set(const struct lu_env *env,
        }
 }
 
+static inline void tgt_open_obj_set(const struct lu_env *env,
+                                  struct dt_object *obj)
+{
+       struct tgt_session_info *tsi;
+
+       if (env->le_ses != NULL) {
+               tsi = tgt_ses_info(env);
+               tsi->tsi_open_obj = obj;
+       }
+}
+
 static inline void tgt_opdata_set(const struct lu_env *env, __u64 flags)
 {
        struct tgt_session_info *tsi;
@@ -284,30 +355,22 @@ enum tgt_handler_flags {
        /*
         * struct *_body is passed in the incoming message, and object
         * identified by this fid exists on disk.
-        *                            *
-        * "habeo corpus" == "I have a body"
         */
-       HABEO_CORPUS = (1 << 0),
+       HAS_BODY        = BIT(0),
        /*
         * struct ldlm_request is passed in the incoming message.
-        *
-        * "habeo clavis" == "I have a key"
-        *                                     */
-       HABEO_CLAVIS = (1 << 1),
+        */
+       HAS_KEY         = BIT(1),
        /*
         * this request has fixed reply format, so that reply message can be
         * packed by generic code.
-        *
-        * "habeo refero" == "I have a reply"
         */
-       HABEO_REFERO = (1 << 2),
+       HAS_REPLY       = BIT(2),
        /*
         * this request will modify something, so check whether the file system
         * is readonly or not, then return -EROFS to client asap if necessary.
-        *
-        * "mutabor" == "I shall modify"
         */
-       MUTABOR      = (1 << 3)
+       IS_MUTABLE      = BIT(3)
 };
 
 struct tgt_handler {
@@ -320,7 +383,7 @@ struct tgt_handler {
        /* Flags in enum tgt_handler_flags */
        __u32                    th_flags;
        /* Request version for this opcode */
-       int                      th_version;
+       enum lustre_msg_version  th_version;
        /* Handler function */
        int                     (*th_act)(struct tgt_session_info *tsi);
        /* Handler function for high priority requests */
@@ -357,6 +420,10 @@ static inline bool tgt_is_multimodrpcs_client(struct obd_export *exp)
        return exp_connect_flags(exp) & OBD_CONNECT_MULTIMODRPCS;
 }
 
+static inline bool tgt_is_increasing_xid_client(struct obd_export *exp)
+{
+       return exp_connect_flags2(exp) & OBD_CONNECT2_INC_XID;
+}
 
 /* target/tgt_handler.c */
 int tgt_request_handle(struct ptlrpc_request *req);
@@ -373,8 +440,6 @@ int tgt_convert(struct tgt_session_info *tsi);
 int tgt_bl_callback(struct tgt_session_info *tsi);
 int tgt_cp_callback(struct tgt_session_info *tsi);
 int tgt_llog_open(struct tgt_session_info *tsi);
-int tgt_llog_close(struct tgt_session_info *tsi);
-int tgt_llog_destroy(struct tgt_session_info *tsi);
 int tgt_llog_read_header(struct tgt_session_info *tsi);
 int tgt_llog_next_block(struct tgt_session_info *tsi);
 int tgt_llog_prev_block(struct tgt_session_info *tsi);
@@ -390,28 +455,29 @@ int tgt_sync(const struct lu_env *env, struct lu_target *tgt,
 int tgt_io_thread_init(struct ptlrpc_thread *thread);
 void tgt_io_thread_done(struct ptlrpc_thread *thread);
 
-int tgt_extent_lock(struct ldlm_namespace *ns, struct ldlm_res_id *res_id,
-                   __u64 start, __u64 end, struct lustre_handle *lh,
-                   int mode, __u64 *flags);
-void tgt_extent_unlock(struct lustre_handle *lh, enum ldlm_mode mode);
-int tgt_brw_lock(struct ldlm_namespace *ns, struct ldlm_res_id *res_id,
-                struct obd_ioobj *obj, struct niobuf_remote *nb,
-                struct lustre_handle *lh, enum ldlm_mode mode);
-void tgt_brw_unlock(struct obd_ioobj *obj, struct niobuf_remote *niob,
-                   struct lustre_handle *lh, enum ldlm_mode mode);
+int tgt_mdt_data_lock(struct ldlm_namespace *ns, struct ldlm_res_id *res_id,
+                     struct lustre_handle *lh, int mode, __u64 *flags);
+int tgt_extent_lock(const struct lu_env *env, struct ldlm_namespace *ns,
+                   struct ldlm_res_id *res_id, __u64 start, __u64 end,
+                   struct lustre_handle *lh, int mode, __u64 *flags);
+void tgt_data_unlock(struct lustre_handle *lh, enum ldlm_mode mode);
 int tgt_brw_read(struct tgt_session_info *tsi);
 int tgt_brw_write(struct tgt_session_info *tsi);
+int tgt_lseek(struct tgt_session_info *tsi);
 int tgt_hpreq_handler(struct ptlrpc_request *req);
+void tgt_register_lfsck_in_notify_local(int (*notify)(const struct lu_env *,
+                                                     struct dt_device *,
+                                                     struct lfsck_req_local *,
+                                                     struct thandle *));
 void tgt_register_lfsck_in_notify(int (*notify)(const struct lu_env *,
                                                struct dt_device *,
-                                               struct lfsck_request *,
-                                               struct thandle *));
+                                               struct lfsck_request *));
 void tgt_register_lfsck_query(int (*query)(const struct lu_env *,
                                           struct dt_device *,
                                           struct lfsck_request *,
                                           struct lfsck_reply *,
                                           struct lfsck_query *));
-bool req_can_reconstruct(struct ptlrpc_request *req, struct tg_reply_data *trd);
+int req_can_reconstruct(struct ptlrpc_request *req, struct tg_reply_data *trd);
 
 extern struct tgt_handler tgt_sec_ctx_handlers[];
 extern struct tgt_handler tgt_lfsck_handlers[];
@@ -449,12 +515,73 @@ int tgt_client_new(const struct lu_env *env, struct obd_export *exp);
 int tgt_server_data_update(const struct lu_env *env, struct lu_target *tg,
                           int sync);
 int tgt_reply_data_init(const struct lu_env *env, struct lu_target *tgt);
-bool tgt_lookup_reply(struct ptlrpc_request *req, struct tg_reply_data *trd);
-int tgt_add_reply_data(const struct lu_env *env, struct lu_target *tgt,
-                      struct tg_export_data *ted, struct tg_reply_data *trd,
-                      struct thandle *th, bool update_lrd_file);
+int tgt_lookup_reply(struct ptlrpc_request *req, struct tg_reply_data *trd);
+int tgt_mk_reply_data(const struct lu_env *env, struct lu_target *tgt,
+                     struct tg_export_data *ted, struct ptlrpc_request *req,
+                     __u64 opdata, struct thandle *th, bool write_update,
+                     __u64 transno);
 struct tg_reply_data *tgt_lookup_reply_by_xid(struct tg_export_data *ted,
                                               __u64 xid);
+int tgt_tunables_init(struct lu_target *lut);
+void tgt_tunables_fini(struct lu_target *lut);
+void tgt_mask_cksum_types(struct lu_target *lut, enum cksum_types *cksum_types);
+
+/* target/tgt_grant.c */
+static inline int exp_grant_param_supp(struct obd_export *exp)
+{
+       return !!(exp_connect_flags(exp) & OBD_CONNECT_GRANT_PARAM);
+}
+
+/* Blocksize used for client not supporting OBD_CONNECT_GRANT_PARAM.
+ * That's 4KB=2^12 which is the biggest block size known to work whatever
+ * the client's page size is. */
+#define COMPAT_BSIZE_SHIFT 12
+
+void tgt_grant_sanity_check(struct obd_device *obd, const char *func);
+void tgt_grant_connect(const struct lu_env *env, struct obd_export *exp,
+                      struct obd_connect_data *data, bool new_conn);
+void tgt_grant_discard(struct obd_export *exp);
+void tgt_grant_prepare_read(const struct lu_env *env, struct obd_export *exp,
+                           struct obdo *oa);
+void tgt_grant_prepare_write(const struct lu_env *env, struct obd_export *exp,
+                            struct obdo *oa, struct niobuf_remote *rnb,
+                            int niocount);
+void tgt_grant_commit(struct obd_export *exp, unsigned long grant_used, int rc);
+int tgt_grant_commit_cb_add(struct thandle *th, struct obd_export *exp,
+                           unsigned long grant);
+long tgt_grant_create(const struct lu_env *env, struct obd_export *exp,
+                     s64 *nr);
+int tgt_statfs_internal(const struct lu_env *env, struct lu_target *lut,
+                       struct obd_statfs *osfs, time64_t max_age,
+                       int *from_cache);
+ssize_t tot_dirty_show(struct kobject *kobj, struct attribute *attr,
+                      char *buf);
+ssize_t tot_granted_show(struct kobject *kobj, struct attribute *attr,
+                        char *buf);
+ssize_t tot_pending_show(struct kobject *kobj, struct attribute *attr,
+                        char *buf);
+ssize_t grant_compat_disable_show(struct kobject *kobj, struct attribute *attr,
+                                 char *buf);
+ssize_t grant_compat_disable_store(struct kobject *kobj,
+                                  struct attribute *attr,
+                                  const char *buffer, size_t count);
+#if LUSTRE_VERSION_CODE < OBD_OCD_VERSION(2, 16, 53, 0)
+ssize_t sync_lock_cancel_show(struct kobject *kobj,
+                             struct attribute *attr, char *buf);
+ssize_t sync_lock_cancel_store(struct kobject *kobj, struct attribute *attr,
+                              const char *buffer, size_t count);
+#endif
+
+/* FMD */
+void tgt_fmd_update(struct obd_export *exp, const struct lu_fid *fid,
+                   __u64 xid);
+bool tgt_fmd_check(struct obd_export *exp, const struct lu_fid *fid,
+                  __u64 xid);
+#ifdef DO_FMD_DROP
+void tgt_fmd_drop(struct obd_export *exp, const struct lu_fid *fid);
+#else
+#define tgt_fmd_drop(exp, fid) do {} while (0)
+#endif
 
 /* target/update_trans.c */
 int distribute_txn_init(const struct lu_env *env,