Whamcloud - gitweb
client capa list is sorted.
[fs/lustre-release.git] / lustre / obdclass / capa.c
index 0fa7afe..5646ec1 100644 (file)
@@ -55,6 +55,8 @@ struct hlist_head *capa_hash;
 struct list_head capa_list[3];
 static int capa_count[3] = { 0 };
 
+static char *capa_type_name[] = { "client", "mds", "filter" };
+
 /* TODO: mdc and llite all need this, so define it here.
  * in the future it will be moved to ll_sb_info to support multi-
  * mount point */
@@ -66,18 +68,17 @@ EXPORT_SYMBOL(capa_list);
 EXPORT_SYMBOL(ll_capa_timer);
 
 static inline int const
-capa_hashfn(unsigned int uid, int capa_op, __u64 mdsid, unsigned long ino)
+capa_hashfn(unsigned int uid, __u64 mdsid, unsigned long ino)
 {
-        return (ino ^ uid) * (unsigned long)capa_op * (unsigned long)mdsid %
-               NR_CAPAHASH;
+        return (ino ^ uid) * (unsigned long)(mdsid + 1) % NR_CAPAHASH;
 }
 
 int capa_op(int flags)
 {
         if (flags & (FMODE_WRITE|MDS_OPEN_TRUNC))
-                return MAY_WRITE;
+                return CAPA_WRITE;
         else if (flags & FMODE_READ)
-                return MAY_READ;
+                return CAPA_READ;
 
         LBUG(); /* should be either MAY_READ or MAY_WRITE */
         return 0;
@@ -85,57 +86,88 @@ int capa_op(int flags)
 
 static struct obd_capa *
 find_capa(struct hlist_head *head, uid_t uid, int capa_op, __u64 mdsid,
-          unsigned long ino, int type)
+          unsigned long ino, __u32 igen, int type)
 {
         struct hlist_node *pos;
         struct obd_capa *ocapa;
-        ENTRY;
-
-        CDEBUG(D_CACHE, "find_capa uid %u op %u mdsid "LPU64" ino %lu "
-               "type %d\n", uid, capa_op, mdsid, ino, type);
+        uid_t ouid;
 
+        CDEBUG(D_INODE, "find capa for (uid %u, op %d, mdsid "LPU64", ino %lu"
+               " igen %u, type %d\n", (unsigned) uid, capa_op, mdsid, ino, igen, type);
         hlist_for_each_entry(ocapa, pos, head, c_hash) {
-                if (ocapa->c_capa.lc_uid != uid)
+                if (ocapa->c_capa.lc_ino != ino)
                         continue;
-                if (ocapa->c_capa.lc_op != capa_op)
+                if (ocapa->c_capa.lc_igen != igen)
                         continue;
                 if (ocapa->c_capa.lc_mdsid != mdsid)
                         continue;
-                if (ocapa->c_capa.lc_ino != ino)
+                if ((ocapa->c_capa.lc_op & capa_op) != ocapa->c_capa.lc_op)
                         continue;
                 if (ocapa->c_type != type)
                         continue;
-                RETURN(ocapa);
+
+                if (ocapa->c_type == CLIENT_CAPA)
+                        ouid = ocapa->c_capa.lc_ruid;
+                else
+                        ouid = ocapa->c_capa.lc_uid;
+
+                if (ouid != uid)
+                        continue;
+
+                DEBUG_CAPA(D_INODE, &ocapa->c_capa, "found %s",
+                           capa_type_name[ocapa->c_type]);
+
+                return ocapa;
         }
 
-        RETURN(NULL);
+        return NULL;
+}
+
+static struct obd_capa *
+filter_find_capa(struct hlist_head *head, struct lustre_capa *capa)
+{
+        struct hlist_node *pos;
+        struct obd_capa *ocapa;
+
+        hlist_for_each_entry(ocapa, pos, head, c_hash) {
+                if (ocapa->c_type != FILTER_CAPA)
+                        continue;
+                if (!memcmp(&ocapa->c_capa, capa,
+                            sizeof(struct lustre_capa_data))) {
+
+                        DEBUG_CAPA(D_INODE, &ocapa->c_capa, "found %s",
+                                   capa_type_name[ocapa->c_type]);
+                        return ocapa;
+                }
+        }
+
+        return NULL;
 }
 
 inline void __capa_get(struct obd_capa *ocapa)
 {
-        atomic_inc(&ocapa->c_refc);
+        if (ocapa->c_type != CLIENT_CAPA)
+                atomic_inc(&ocapa->c_refc);
 }
 
 static struct obd_capa *
 find_capa_locked(struct hlist_head *head, uid_t uid, int capa_op, __u64 mdsid,
-                 unsigned long ino, int type)
+                 unsigned long ino, __u32 igen, int type)
 {
         struct obd_capa *ocapa;
-        ENTRY;
 
         spin_lock(&capa_lock);
-        ocapa = find_capa(head, uid, capa_op, mdsid, ino, type);
+        ocapa = find_capa(head, uid, capa_op, mdsid, ino, igen, type);
         if (ocapa)
                 __capa_get(ocapa);
         spin_unlock(&capa_lock);
 
-        RETURN(ocapa);
+        return ocapa;
 }
 
 static struct obd_capa *alloc_capa(void)
 {
         struct obd_capa *ocapa;
-        ENTRY;
 
         OBD_SLAB_ALLOC(ocapa, capa_cachep, SLAB_NOFS, sizeof(*ocapa));
         if (ocapa) {
@@ -143,7 +175,14 @@ static struct obd_capa *alloc_capa(void)
                 INIT_LIST_HEAD(&ocapa->c_list);
         }
 
-        RETURN(ocapa);
+        return ocapa;
+}
+
+static void __capa_put(struct obd_capa *ocapa)
+{
+        hlist_del_init(&ocapa->c_hash);
+        list_del_init(&ocapa->c_list);
+        capa_count[ocapa->c_type]--;
 }
 
 static void destroy_capa(struct obd_capa *ocapa)
@@ -173,13 +212,14 @@ int capa_cache_init(void)
 
 void capa_cache_cleanup(void)
 {
-        struct obd_capa *ocapa;
-        struct hlist_node *pos, *n;
+        struct obd_capa *ocapa, *tmp;
+        int i;
 
-        hlist_for_each_entry_safe(ocapa, pos, n, capa_hash, c_hash) {
-                hlist_del(&ocapa->c_hash);
-                list_del(&ocapa->c_list);
-                OBD_FREE(ocapa, sizeof(*ocapa));
+        for (i = MDS_CAPA; i <= FILTER_CAPA; i++) {
+                list_for_each_entry_safe(ocapa, tmp, &capa_list[i], c_list) {
+                        __capa_put(ocapa);
+                        destroy_capa(ocapa);
+                }
         }
 
         OBD_FREE(capa_hash, PAGE_SIZE);
@@ -198,50 +238,53 @@ static inline void list_add_capa(struct obd_capa *ocapa, struct list_head *head)
                                 return;
                         }
                 }
+                list_add(&ocapa->c_list, head);
+                return;
         }
 
         list_add_tail(&ocapa->c_list, head);
 }
 
-#define DEBUG_CAPA(level, ocapa, fmt, args...)                                 \
-do {                                                                           \
-CDEBUG(level, fmt " capa@%p uid %u op %u ino "LPU64" mdsid %d keyid %d "       \
-       "expiry "LPU64" flags %u type %d\n",                                    \
-       ##args, ocapa, ocapa->c_capa.lc_uid, ocapa->c_capa.lc_op,               \
-       ocapa->c_capa.lc_ino, ocapa->c_capa.lc_mdsid, ocapa->c_capa.lc_keyid,   \
-       ocapa->c_capa.lc_expiry, ocapa->c_capa.lc_flags, ocapa->c_type);        \
-} while (0)
+static inline void do_update_capa(struct obd_capa *ocapa, struct lustre_capa *capa)
+{
+        memcpy(&ocapa->c_capa, capa, sizeof(*capa));
+}
 
 static struct obd_capa *
-get_new_capa_locked(struct hlist_head *head, uid_t uid, int capa_op,__u64 mdsid,
-                    unsigned long ino, int type, struct lustre_capa *capa,
-                    struct inode *inode, struct lustre_handle *handle)
+get_new_capa_locked(struct hlist_head *head, int type, struct lustre_capa *capa)
 {
+        uid_t uid = capa->lc_uid;
+        int capa_op = capa->lc_op;
+        __u64 mdsid = capa->lc_mdsid;
+        unsigned long ino = capa->lc_ino;
         struct obd_capa *ocapa, *old;
-        ENTRY;
 
         ocapa = alloc_capa();
         if (!ocapa)
-                RETURN(NULL);
+                return NULL;
 
         spin_lock(&capa_lock);
-        old = find_capa(head, uid, capa_op, mdsid, ino, type);
+
+        if (type == FILTER_CAPA)
+                old = filter_find_capa(head, capa);
+        else
+                old = find_capa(head, uid, capa_op, mdsid, ino,
+                                capa->lc_igen, type);
+
         if (!old) {
-                memcpy(&ocapa->c_capa, capa, sizeof(*capa));
+                do_update_capa(ocapa, capa);
                 ocapa->c_type = type;
-                if (type == CLIENT_CAPA) {
-                        LASSERT(inode);
-#ifdef __KERNEL__
-                        igrab(inode);
-#endif
-                        ocapa->c_inode = inode;
-                        memcpy(&ocapa->c_handle, handle, sizeof(*handle));
-                }
                 list_add_capa(ocapa, &capa_list[type]);
-                hlist_add_head(&ocapa->c_hash, capa_hash);
-                capa_count[type]++;
-                DEBUG_CAPA(D_CACHE, ocapa, "get_new_capa_locked");
+                hlist_add_head(&ocapa->c_hash, head);
+                if (type == CLIENT_CAPA)
+                        INIT_LIST_HEAD(&ocapa->c_lli_list);
                 __capa_get(ocapa);
+
+                capa_count[type]++;
+
+                DEBUG_CAPA(D_INODE, &ocapa->c_capa, "new %s",
+                           capa_type_name[type]);
+
                 if (type != CLIENT_CAPA && capa_count[type] > CAPA_CACHE_SIZE) {
                         struct list_head *node = capa_list[type].next;
                         struct obd_capa *tcapa;
@@ -249,130 +292,117 @@ get_new_capa_locked(struct hlist_head *head, uid_t uid, int capa_op,__u64 mdsid,
 
                         /* free 12 unused capa from head */
                         while (node->next != &capa_list[type] && count < 12) {
-                                tcapa = list_entry(node, struct obd_capa, c_list);
+                                tcapa = list_entry(node, struct obd_capa,
+                                                   c_list);
                                 node = node->next;
                                 if (atomic_read(&tcapa->c_refc) > 0)
                                         continue;
-                                list_del(&tcapa->c_list);
+                                DEBUG_CAPA(D_INODE, &tcapa->c_capa,
+                                           "free unused %s",
+                                           capa_type_name[type]);
+                                __capa_put(tcapa);
                                 destroy_capa(tcapa);
                                 count++;
                         }
                 }
                                         
                 spin_unlock(&capa_lock);
-                RETURN(ocapa);
+                return ocapa;
         }
-
-        __capa_get(old);
         spin_unlock(&capa_lock);
+
         destroy_capa(ocapa);
-        ocapa = old;
-        RETURN(ocapa);
+        return old;
 }
 
-static struct obd_capa *
-capa_get_locked(uid_t uid, int capa_op,__u64 mdsid, unsigned long ino,
-                int type, struct lustre_capa *capa, struct inode *inode,
-                struct lustre_handle *handle)
+struct obd_capa *
+capa_get(uid_t uid, int capa_op,__u64 mdsid, unsigned long ino,
+         __u32 igen, int type)
 {
-        struct hlist_head *head = capa_hash +
-                                  capa_hashfn(uid, capa_op, mdsid, ino);
+        struct hlist_head *head = capa_hash + capa_hashfn(uid, mdsid, ino);
         struct obd_capa *ocapa;
-        ENTRY;
 
-        ocapa = find_capa_locked(head, uid, capa_op, mdsid, ino, type);
-        if (ocapa)
-                RETURN(ocapa);
+        ocapa = find_capa_locked(head, uid, capa_op, mdsid, ino, igen, type);
         
-        if (capa)
-                ocapa = get_new_capa_locked(head, uid, capa_op, mdsid, ino,
-                                            type, capa, inode, handle);
-        RETURN(ocapa);
+        return ocapa;
 }
 
-struct obd_capa *
-capa_get(uid_t uid, int capa_op, __u64 mdsid, unsigned long ino, int type,
-         struct lustre_capa *capa, struct inode *inode,
-         struct lustre_handle *handle)
+struct obd_capa * filter_capa_get(struct lustre_capa *capa)
 {
-        return capa_get_locked(uid, capa_op, mdsid, ino, type, capa, inode,
-                               handle);
-}
+        struct hlist_head *head = capa_hash +
+                capa_hashfn(capa->lc_uid, capa->lc_mdsid, capa->lc_ino);
+        struct obd_capa *ocapa;
 
-static void __capa_put(struct obd_capa *ocapa, int type)
-{
-        hlist_del_init(&ocapa->c_hash);
-        list_del_init(&ocapa->c_list);
-        capa_count[type]--;
+        spin_lock(&capa_lock);
+        ocapa = filter_find_capa(head, capa);
+        if (ocapa)
+                __capa_get(ocapa);
+        spin_unlock(&capa_lock);
+        return ocapa;
 }
 
-void capa_put(struct obd_capa *ocapa, int type)
+void capa_put(struct obd_capa *ocapa)
 {
-        ENTRY;
+        if (!ocapa)
+                return;
 
-        if (ocapa) {
-                if (atomic_dec_and_lock(&ocapa->c_refc, &capa_lock)) {
-                        if (type == CLIENT_CAPA) {
-#ifdef __KERNEL__
-                                iput(ocapa->c_inode);
-#endif
-                                __capa_put(ocapa, type);
-                                destroy_capa(ocapa);
-                        }
-                        spin_unlock(&capa_lock);
-                }
+        DEBUG_CAPA(D_INODE, &ocapa->c_capa, "put %s",
+                   capa_type_name[ocapa->c_type]);
+        spin_lock(&capa_lock);
+        if (ocapa->c_type == CLIENT_CAPA) {
+                list_del_init(&ocapa->c_lli_list);
+                __capa_put(ocapa);
+                destroy_capa(ocapa);
+        } else {
+                atomic_dec(&ocapa->c_refc);
         }
-
-        EXIT;
-}
-
-static inline void __update_capa(struct obd_capa *ocapa, struct lustre_capa *capa)
-{
-        memcpy(&ocapa->c_capa, capa, sizeof(*capa));
+        spin_unlock(&capa_lock);
 }
 
-static int update_capa_locked(struct lustre_capa *capa, int type)
+struct obd_capa *capa_renew(struct lustre_capa *capa, int type)
 {
         uid_t uid = capa->lc_uid;
         int capa_op = capa->lc_op;
         __u64 mdsid = capa->lc_mdsid;
         unsigned long ino = capa->lc_ino;
         struct hlist_head *head = capa_hash +
-                                  capa_hashfn(uid, capa_op, mdsid, ino);
+                                  capa_hashfn(uid, mdsid, ino);
         struct obd_capa *ocapa;
-        ENTRY;
 
         spin_lock(&capa_lock);
-        ocapa = find_capa(head, uid, capa_op, mdsid, ino, type);
-        if (ocapa)
-                __update_capa(ocapa, capa);
-        spin_unlock(&capa_lock);
 
-        if (ocapa == NULL && type == MDS_CAPA)
-                ocapa = get_new_capa_locked(head, uid, capa_op, mdsid, ino, type,
-                                            capa, NULL, NULL);
+        if (type == FILTER_CAPA)
+                ocapa = filter_find_capa(head, capa);
+        else
+                ocapa = find_capa(head, uid, capa_op, mdsid, ino,
+                                  capa->lc_igen, type);
+        if (ocapa) {
+                DEBUG_CAPA(D_INFO, capa, "renew %s", capa_type_name[type]);
+                do_update_capa(ocapa, capa);
+        }
 
-        RETURN(ocapa ? 0 : -ENOENT);
-}
+        spin_unlock(&capa_lock);
 
-int capa_renew(struct lustre_capa *capa, int type)
-{
-        return update_capa_locked(capa, type);
+        if (!ocapa)
+                ocapa = get_new_capa_locked(head, type, capa);
+
+        return ocapa;
 }
 
-void capa_hmac(struct crypto_tfm *tfm, __u8 *key, struct lustre_capa *capa)
+void capa_hmac(__u8 *key, struct lustre_capa *capa)
 {
+        struct crypto_tfm *tfm;
         int keylen = CAPA_KEY_LEN;
         struct scatterlist sl = {
                 .page   = virt_to_page(capa),
                 .offset = (unsigned long)(capa) % PAGE_SIZE,
                 .length = sizeof(struct lustre_capa_data),
         };
-        ENTRY;
 
+        tfm = crypto_alloc_tfm(CAPA_HMAC_ALG, 0);
         LASSERT(tfm);
         crypto_hmac(tfm, key, &keylen, &sl, 1, capa->lc_hmac);
-        EXIT;
+        crypto_free_tfm(tfm);
 }
 
 void capa_dup(void *dst, struct obd_capa *ocapa)
@@ -394,24 +424,27 @@ int capa_expired(struct lustre_capa *capa)
         struct timeval tv;
 
         do_gettimeofday(&tv);
-        return (capa->lc_expiry < tv.tv_sec) ? 1 : 0;
+        return ((unsigned long )capa->lc_expiry <= tv.tv_sec) ? 1 : 0;
 }
 
-int __capa_is_to_expire(struct obd_capa *ocapa)
+int __capa_is_to_expire(struct obd_capa *ocapa, struct timeval *tv)
 {
-        struct timeval tv;
         int pre_expiry = capa_pre_expiry(&ocapa->c_capa);
 
-        do_gettimeofday(&tv);
-        return (ocapa->c_capa.lc_expiry - pre_expiry < tv.tv_sec)? 1 : 0;
+        /* XXX: in case the clock is inaccurate, minus one more
+         * pre_expiry to make sure the expiry won't miss */
+        return ((unsigned long)ocapa->c_capa.lc_expiry -
+                2 * pre_expiry <= tv->tv_sec)? 1 : 0;
 }
 
 int capa_is_to_expire(struct obd_capa *ocapa)
 {
+        struct timeval tv;
         int rc;
 
+        do_gettimeofday(&tv);
         spin_lock(&capa_lock);
-        rc = __capa_is_to_expire(ocapa);
+        rc = __capa_is_to_expire(ocapa, &tv);
         spin_unlock(&capa_lock);
 
         return rc;
@@ -419,6 +452,7 @@ int capa_is_to_expire(struct obd_capa *ocapa)
 
 EXPORT_SYMBOL(capa_op);
 EXPORT_SYMBOL(capa_get);
+EXPORT_SYMBOL(filter_capa_get);
 EXPORT_SYMBOL(capa_put);
 EXPORT_SYMBOL(capa_renew);
 EXPORT_SYMBOL(__capa_get);